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图 灵 社 区 的 电子 书 没有 采用 专 有 客 
尸 问 ， 您 可 以 在 任意 设备 上 ， H 
C= KAY bt ee FO PDF il i Bet 
PIX. 


但 您 购买 的 电子 书 仅 供 您 个 人 使 
用 ,未 经 授权 ， 不 得 进行 传播 。 
我 们 愿意 相信 读者 具有 这 样 的 民 知 
和 觉悟 ， 与 我 们 共同 保护 知识 产 
权 。 


如 果 购 买 者 有 侵权 行为 ， 我 们 可 能 
对 该 用 尸 实 施 包 括 但 不 限于 关闭 该 
帐号 等 维权 措施 ， 并 可 能 退 究 法 律 
贡 任 。 
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内 容 提 要 
本 书 集合 了 几 十 位 软件 工程 领域 顶尖 研究 人 员 的 实证 研究 ， 通 过 至 现 他 们 长 达 几 年 甚至 几 十 年 的 研究 
成 果 ， 揭 示 了 软件 开发 社区 普遍 存在 的 一 些 确 溺 事实 和 虚构 之 事 。 书 中 探讨 了 更 有 效 的 编程 语言 ， 对 比 了 
软件 开发 人 员 之 间 的 效率 差异 ， 验 证 了 康 威 定 理 ， 并 反思 了 软件 行业 的 最 新 模式 。 本 书 将 帮助 读者 拓宽 
视野 ， 更 好 地 选择 适合 的 工具 和 技术 ， 并 最 终 成 为 一 名 更 加 优秀 的 软件 行业 从 业 人 员 。 
本 书 适 合 所 有 软件 开发 人 员 和 人 研究 人 员 阅 读 。 
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O’ Reilly Media, Inc. 介 绍 


O Reilly Media 通 过 图 书 、 在 线 服务 、 洒 志 、 调 查 人 研究 和 会 议 等 方式 传播 创新 者 的 知识 。 自 
1978 年 开始 O Reilly 一 直 邦 古 发 展 前 沿 的 见证 者 和 推动 者 。 超 级 极 客 正在 开创 未 来 ， 我 们 关注 着 
真正 重要 的 技术 趋势 ,通过 放大 那些 “微弱 的 信 写 ”来 刺激 社会 对 新 科技 的 采用 。 作 为 技术 社区 
中 活跃 的 参与 者 ，O Reilly 的 发 展 充满 着 对 创新 的 倡 寻 、 创 千 和 发 扬 光 大 。 

作为 出 版 商 O Reilly 为 软件 开发 人 员 市 来 羊 命 性 的 “动物 书 ， 创 造 了 第 一 个 商业 网 站 
(GNN) ， 组 织 开 放 源 代码 峰会 以 至 于 开源 软件 运动 以 此 命名 ， 通 过 创立 Make 杂 志 成 为 DIY 羊 命 
的 主要 先锋 ， 公 司 一 如 既往 地 用 各 种 方式 和 渠道 连接 人 们 和 他 们 所 需要 的 信息 。O Reilly 的 会 议 
和 峰会 聚集 了 超级 极 客 和 高 瞻 远 瞩 的 商业 领袖 ,共同 括 绘 将 开创 新 产业 的 章 命 性 思想 。 作 为 技术 
人 士 获取 信息 的 选择 ，O Reilly 现 在 还 将 先锋 专家 的 知识 传递 给 普通 计算 机 用 户 。 无 论 是 通过 印 
刷 书 籍 、 在 线 服务 或 者 面授 读 程 ， 每 一 项 O Reilly 的 产品 都 反映 了 公司 不 可 动摇 的 信念 一 一 信息 
征 油 发 创新 的 力量 。 


业界 评论 


“O’ Reilly Radar 博 客 有 口 4 ae,” 











Wired 
“O "Reilly 和 凭借 一 系列 (真希 望 当 初 我 也 想到 了 ) 非凡 想法 建立 了 数 百 万 美元 的 业务 。” 


Business 2.0 








“O’ Reilly Conference 是 聚集 关键 思想 领袖 的 绝对 典范 。 
——§CRN 
一 本 O Reilly 的 书 就 代表 一 个 有 用 、 有 前 途 、 需 要 学 习 的 主题 。 
Irish Times 
Tim 是 位 少 有 的 商人 ， 他 不 光 放 眼 于 最 长 远 、 最 广阔 的 视野 ， 并 且 切 实地 按照 Yogi Berra 的 
建议 去 做 了 :如果 你 在 路 上 遇 到 岔路 口 ， 走 小 路 (SH) 。 回 顾 过 去 ，Tim 似 乎 每 一 次 都 选择 了 
小 路 ， 而 且 有 几 次 部 是 一 闪 即 逝 的 机 会 ， 尽管 大 路 也 不 锚 。 
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2 译 者 序 


本 书 的 翻译 团队 包括 鲍 央 舟 、 沈 欢 星 和 张 珠 ， 三 者 均 为 软件 行业 从 业 人 员 。 在 半年 中 抽取 了 
大 量 空余 时 间 投 入 本 书 的 翻译 和 审 校 工作 。 在 翻译 的 过 程 中 ,过 到 了 众多 数学 、 统 计 学 、 心 理学 
的 专业 术语 ， 在 一 些 朋 友 的 帮助 下 ， 才 得 以 顺利 完成 。 在 这 里 想 感谢 所 有 帮助 过 我 们 的 朋友 ， 也 
感谢 我 的 公司 Out Softing 对 我 工作 的 支持 。 如 有 踢 漏 和 不 足 之 处 ， 币 望 广大 读者 批评 指正 。 
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MMR ARDRE? HALE EAS ELE PAT ae NS) See RE Ta a EE He 
一 些 更 好 吗 ? 人 们 每 天 都 会 争论 这 些 问 题 。 BEV AANA i EE 小 心地 
收集 证 据 ， 公 平地 评 合 效 末 。 然 而 ， 迄 今 为 止 ， 很 少 有 人 试图 用 这 样 的 技 马 来 回答 第 三 个 同 题 。 
当 说 到 计算 机 相关 工作 的 时 候 , 边 唱 啤 酒 边 说 出 来 的 有 关 华 沙 创 业 公 司 的 轶 事 , 通 第 就 是 大 部 分 
程序 员 所 期 望 的 所 有 “证据” 了 。 

这 种 情况 正在 改变 ， 部 分 归功 于 本 书 撰 稿 人 的 工作 。 本 书 作 者 和 他 们 的 同事 从 不 同 领域 获 
取 数 据 ， 诸 如 数据 挖 据 、 认 知心 理学 以 及 社会 学 …… 他 们 正在 创造 一 种 软件 工程 的 循 证 方法 。 
通过 从 无 数 和 初始 材料 中 搜集 证 据 并 分 析 结 末 , 他 们 正在 为 一 些 软件 工程 的 恼人 辣 题 市 来 新 的 光 
明 。 大 部 分 程序 员 在 他 们 的 第 一 份 工作 中 会 如 何 出 错 ?” 神 试 驱动 开发 会 产生 更 好 的 代码 吗 ? 结 
对 编程 或 代码 审查 又 如 何 ?” 可 能 在 发 布 之 前 预测 一 段 代码 中 缺陷 的 大 概 数 目 吗 ?如 琳 能 的话， 
怎么 做 ? 

这 本 书 中 的 论文 会 提供 一 些 问 题 的 解答 , 并 解释 为 什么 其 他 问题 仍然 没有 冤案 。 同 样 重要 的 
征 ， 它 们 会 告诉 你 如 何 用 定量 和 定性 的 方法 上 自己 找到 并 评估 证据 。 每 个 程序 员 都 是 独特 的 ， 也 设 
有 任何 两 个 程序 是 完全 相同 的 ， 但 如 琳 你 仔细 、 耐 心 、 开 明 的 话 ， 就 能 说 服 他 们 说 出 秘密 。 

我 们 希望 本 书 中 的 问题 和 解答 能 改变 你 对 软件 开发 的 想法 。 我 们 也 希望 这 些 论文 能 说 服 你 ， 
在 下 次 有 人 声称 C 和 Java 中 这 样 放置 大 括号 比 那 样 放置 更 好 的 时 候 ， 你 会 说 “请 举证 ”。 和 《 代 
码 之 美 》 一 样 (Andy 和 Greg 与 OReilly 的 上 次 合作 ) ， 作 者 的 所 有 版 税 会 捐赠 于 有 关机 构 。 


本 书 的 结构 


本 书 中 的 每 一 草 广 都 来 自 不 同 的 撰 稿 人 或 团队 。 顺 序 并 不 重要 ， 但 是 我 们 把 一 些 关 于 人 研究 、 
有 效 性 和 其 他 具有 高 层 意义 的 章节 放 在 开头 。 我 们 觉得 在 读 过 第 一 部 分 后 ， 读 者 会 擎 握 一 定 背 景 
知识 ， 从 而 能 更 好 地 理解 第 二 部 分 的 内 容 。 

第 一 部 分 包含 以 下 内 容 : 

第 1 童 ” 探寻 有 力 的 证 所 (Tim Menzies 和 Forrest Shull ) 

Ble ”可 信和 度 ， 为 什么 我 坚决 要 求 确信 的 证 据 (Lutz Prechelt 和 Marian Petre ) 
































@ 该 书 由 机 械 工业 出 版 社 于 2009 年 出 版 。 一 一 编者 注 
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第 3 章 ”我 们 能 从 系统 性 评审 中 学 到 什么 (Barbara Kitchenham3; ) 

第 4 章 ” 用 定性 研究 方法 来 理解 软件 工程 学 (Andrew Ko %) 

第 5 章 ”在 实践 中 学 习 成 长 : 软件 工程 实验 室 中 的 质量 改进 范式 (Victor R. Basili 著 ) 

第 6 章 性格、 智力 和 专业 技能 对 软件 开发 的 影响 (Jo E. Hannay ) 

第 7 章 ”为 什么 学 编程 这 么 难 (Mark Guzdial 闭 ) 

第 8 革 ”超越 代码 行 : 我 们 还 需要 其 他 的 复杂 度 指标 吗 (Israel Herraiz 和 Ahmed E. Hassan 著 ) 


第 二 部 分 包含 以 下 内 容 : 
第 9 章 ”自动 故障 预报 系统 实例 一 则 (Elaine J. Weyuker 和 Thomas J. Ostrand 著 ) 


第 10 半 
PI 
第 12 划 


第 13 半 
第 14 半 
a LSE 
第 16 半 
第 17 半 
第 18 半 
a LOE 
第 20 半 
第 21 半 
P22 
qo 23 
of 24 FE 
第 25 半 
第 26 半 
第 27 半 
第 28 半 
第 29 瘟 
第 30 半 


架构 设计 的 程度 和 时 机 (Barry Boehm# ) 
康 威 推论 (Christian Bird 和 车) 
测试 驱动 开发 的 效果 如 何 (Burak Turhan, Lucas Layman, Madeline Diep, Hakan 
Erdogmus 和 和 Forrest Shull 和 车 ) 
为 何 计 算 机 科学 领域 的 女性 不 多 (Michele A. Whitecraft 和 Wendy M. Williams ) 
两 个 关于 编程 语言 的 比较 (Lutz Prechelt# ) 
质量 之 战 : 开源 软件 对 战 专 有 软件 (Diomidis Spinellis 若 ) 
人 码 语 者 (Robert DeLine 和 车 ) 
结对 编程 (Laurie Williams# ) 
现代 化 代码 审查 (Jason Cohen 著 ) 
公共 办 公 室 还 是 私人 办 公 室 (Jorge Aranda ) 
识别 及 管理 全 球 性 软件 开发 中 的 依赖 关系 (Marcelo Cataldo 著 ) 
模块 化 的 效果 如 何 (Neil Thomas 和 Gail Murphy% ) 
设计 模式 的 证 据 (Walter Tichy 和 车 ) 
人 循 证 故障 预测 (Nachiappan Nagappan 和 Thomas Ball3 ) 
采集 缺陷 报告 的 艺术 (Rahul Premraj 和 Thomas Zimmermann% ) 
软件 的 缺陷 都 从 哪儿 来 (Dewayne Perry 3) 
新 手 专家 : 软件 行业 的 应 届 毕 业 生 们 (Andrew Begel 和 Beth Simon# ) 
挖掘 你 自己 的 证 据 (Kim Sebastian Herzig 和 Andreas Zellers ) 
正当 使 用 “复制 -粘贴 ”大 法 (Michael Godfrey 和 Cory Kapser# ) 
你 的 API 有 多 好 用 (Steven Clarke) 
“10 倍 ”意味 着 什么 ”编程 生产 力 的 差距 测量 





(Steve McConnell 著 ) 


本 书 的 排版 规 学 


本 书 使 用 的 排版 规 苑 如 下 所 示 。 


ee 


用 于 表示 新 的 术语 。 


eHUUU 

表示 程序 片段 ， 也 在 段落 中 表示 程序 中 使 用 的 变量 、 函 数 名 、 命 令 行 实 用 工具 、 环 境 变 量 、 
语句 和 关键 字 等 元 素 。 

eHUUU 

这 种 字体 表示 用 户 需 要 手动 输入 的 命令 或 者 相应 的 文本 。 

e D0DU0 

用 户 需 要 根据 自己 所 提供 的 值 或 由 上 下 文 所 确定 的 值 进行 更 改 的 部 分 。 


Safari* 在 线 图 书 


S afar Safari 在 线 图 书 是 应 知 而 变 的 数字 图 书馆 。 它 能 够 让 你 非 第 轻松 地 搜索 7500 多 种 
Books Online 技术 性 和 创新 性 参考 书 以 及 视频 ’ 以 便 快 速 地 找 到 需要 的 答案 o 


订阅 后 就 可 以 访问 在 线 图 书馆 内 的 所 有 页 面 和 视频 。 可 以 在 手机 或 其 他 移动 设备 上 阅读 。 还 
能 在 新 书 上 市 之 前 抢先 阅读 , 也 能 够 看 到 还 在 创作 中 的 书稿 并 癌 作 者 反馈 意见 。 复 制 粘贴 代码 示 
例 、 放 入 收藏 夹 、 下 载 部 分 草 阁 、 标 记 关 键 点 、 做 笔记 其 至 打印 页 面 等 有 用 的 功能 可 以 节省 大 量 
时 间 。 这 本 书 也 在 其 中 。 

欲 访问 本 书 英 文 版 的 电子 版 ， 或 者 由 O"Reilly 或 其 他 出 版 社 出 版 的 相关 图 书 ， 请 到 http:/my. 
safaribook- sonline.com 人 免费 注册 。 


使 用 代码 范例 


让 本 书 助 你 一 臂 之 力 。 也 许 你 要 在 目 己 的 程序 或 文档 中 用 到 本 书 中 的 代码 。 除 非 大 段 大 段 地 
使 用 ,否则 不 必 与 我 们 联系 取得 授权 。 例 如 ,无 需 请 求 许 可 ,就 可 以 用 本 书 中 的 儿 段 代码 写成 一 
个 程序 。 但 是 销售 或 者 发 布 OReilly 图 书 中 代码 的 光盘 则 必须 事先 获得 授权 。31| 用 书 中 的 代码 来 
回答 问题 也 无 需 授 权 。 将 大 段 的 示例 代码 整合 到 你 自己 的 产品 文档 中 则 必须 经 过 许可 。 

我 们 非常 希望 你 能 标明 出 处 ， 但 并 不 强求 。 出 处 一 般 舍 有 书 名 、 作 者 、 出 版 商 和 ISBN， 例 
如 : “Making Software :What Really Works, and Why We Believe it by Andy Oram and Greg Wilson. 
Copyright 2011 O’Reilly, Media, Inc., 978-0-596-80832-7” , 

如 采 有 关于 使 用 代码 的 未 尽 事宜 ， 可 以 随时 与 我 们 取得 联系 : =permissions@oreilly.com, 
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搜寻 和 使 用 证 据 的 一 般 原 则 





当 研究 人 员 调 奋 程 序 员 的 行为 时 ， 他 们 的 方法 必须 变 得 比 以 往 更 加 精妙 ， 因 为 这 个 环 手 的 
领域 涉及 人 的 因素 。 首 先 ， 我 们 必须 知道 我 们 能 学 多 少 ， 以 及 学 到 什么 程度 时 我 们 必须 接受 知 
识 范 围 的 局 限 性 。 因 此 ， 这 一 菠 会 讨论 一 些 原 则 ， 帮 助 我 们 找到 可 信任 的 软件 工程 数据 ， 并 小 
心 适当 地 运用 于 新 情况 。 章 市 中 会 触及 一 些 数 据 的 运用 ， 但 关 广 的 焦点 还 征 在 于 更 宽 沁 的 主题 ， 
以 期 读者 能 利用 这 些 知 识 更 好 地 解决 软件 工程 中 其 他 的 争议 话题 。 





第 1 章 
探寻 有 力 的 证 据 


Tim Menzies 
Forrest Shull 


是 什么 使 证 据 精 确 、 合 理 、 有 用 并 有 信服 力 ? 这 正 古 本 革 作 者 在 过 去 20 年 中 所 探寻 的 问题 。 
我 们 两 人 在 实证 软件 工程 这 个 话题 上 发 布 的 文 草 数目 加 起 来 部 超过 了 200 篇 ， 组 织 了 无 数 次 专家 
小 组 讨论 、 讲 习 班 、 会 议 以 及 杂志 特刊 的 发 布 。 

在 这 篇 文章 中 , 我 们 想 要 稍微 反思 一 下 。 我 们 回顾 了 迄今 为 止 软件 工程 的 进程 , 并 目 辣 : 这 
到 的 有 什么 好 处 ? “我 们 该 走 同 哪里 ? ”以 下 古 我 们 的 发 现 。 

O 对 有 力 证 据 的 探寻 比 我 们 开始 想 的 要 复 洒 得 多 。 

O 软件 工程 研究 人 员 需 要 更 多 地 工作 在 一 个 团体 中 ， 分 享 更 多 的 证 据 。 

O 我 们 需要 承认 证 据 多 少 征 与 背景 相关 的 。 那 些 使 我 们 信服 的 证 据 并 不 一 定 使 你 们 信 

服 。 因 此 ， 我 们 需要 准备 好 ， 一 旦 听众 改变 ， 就 需要 重新 解释 和 重新 分 析 。 


1.1 起 步 阶 段 


几 十 年 前 ， 当 被 问 起 什么 是 我 们 认为 的 “完美 的 证 据 时 ， 我 们 会 提 到 下 列 这 些 特 征 。 
e 00000 

许多 软件 工程 的 研究 包含 了 人 为 因素 。 因为 很 多 软件 技术 的 有 效 性 很 大 程度 上 依赖 于 使 
用 它们 的 人 “。 但 是 处 理 人 的 可 变性 是 很 具 挑 战 的 。 通 过 精妙 设计 来 最 小 化 这 些 混杂 效应 的 
了 研究 能 使 别 的 研究 者 倍 感 羡 募 。 比 如 ，Basili 和 Selby 的 一 个 研究 ”使 用 了 部 分 析 因 设计 ”, 在 
这 个 设计 中 , 每 个 开发 人 员 使 用 的 都 古 有 待 审 碍 的 技术 , 并 且 所 有 技术 都 被 使 用 在 实验 中 的 
程序 片段 。 
°*HUUUU 

i a BA ARSE, SCT A ee eae RSE a ZS, ME, 人 研究 者 能 对 他 
们 的 理论 在 现实 世界 中 的 作用 有 一 些 信 心 ， 即 使 在 随机 背景 的 干扰 下 也 能 识别 出 来 。 




















© 在 研究 了 161 个 项 目 之 后 ，Boehm 等 人 于 2000 年 发 现 最 好 的 项 目 人 员 的 产 出 率 是 最 差 的 3.5 倍 。 
@ Fractional Factonial Design， 选 择 析 因 实 验 (Factonial Experiment) 的 一 部 分 来 研究 。 一 一 编者 注 
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如 采 结 有 可 以 在 许多 不 同 育 景 下 被 重复 发 现 , 也 就 是 说 , 结 末 不止 局 限于 一 种 背景 或 一 
组 实验 条 件 ， 这 样 的 结 末 会 更 有 说 服 力 ! 在 其 他 学 科 中 ,复制 增强 信心 ， 出 于 这 个 原因 ， 很 
多 人 花 了 很 多 精力 ， 试 图 使 软件 工程 实验 可 简单 地 被 其 他 研究 者 在 其 他 背景 下 重复 运行 ”。 
举 一 个 可 重复 性 的 例子 ，Turhan 证 明了 在 其 他 站 点 习 得 的 软件 缺陷 预报 形 可 以 成 功 运用 于 
新 站 点 ”。 


1.2 ”当今 证 据 的 状态 


回顾 以 往 , 我 们 现在 才 知 道 当 时 对 有 力 证 据 的 定义 是 多 么 幼稚 。 精 确 、 统 计 性 强 、 重 复 证 气 ， 
这 些 都 最 终 被 证 明 比 我 们 想 的 要 难 找 得 多 。 男 外， 它们 并 不 能 满足 与 妍 究 更 相关 的 目标 。 


1.2.1 精确 性 研究 的 挑战 


我 们 发 现 精确 的 研究 可 能 对 那些 接受 过 足够 科研 培训 的 人 来 说 很 有 说 服 力 , 但 对 那些 普通 从 
业者 却 很 难 解释 。 因 为 这 样 的 研究 通常 会 有 所 限制 和 简化， 从 而 使 得 研究 背景 不 是 以 代表 真实 的 
开发 环境 。 比 如 ，Basii 和 Selby 的 研究 仅 针 对 “迷你 ”问题 运用 了 研究 中 的 技巧 ， 该 问题 只 在 虚 
拟 环境 中 有 不 超过 400 行 的 代码 。 这 项 研究 经 前 被 5 引用， 虽然 它 是 被 经 条 复制 的 对 象 ， 但 似乎 没 
有 一 项 复制 使 用 了 更 大 规模 的 或 者 更 具 代表 性 的 应 用 。 虽 然 这 项 精确 的 研究 对 我 们 理解 铲除 代 
AGHA RY ATA SHCA A BORA ook, 但 如 条 我 们 在 这 一 主题 上 的 大 部 分 思维 来 目 相 对 小 的 代 
码 段 ， 这 并 不 理想 。 


1.2.2 统计 强度 的 挑战 


什么 构成 了 对 现实 世界 问题 果 “ 强 有 力 ” 统 计数 字 ? 对 于 这 个 回 题 共识 出 奇 得 少 。 首 先 ， 
有 一 个 关于 外 部 有 效 性 的 问题 : 经 过 充分 测试 的 度量 方法 是 否 能 反映 我 们 所 关注 的 真实 世界 的 现 
象 。 比 如 ，Foss 等 人 证 明了 常用 估计 工作 量 的 评估 方法 根本 就 是 有 问题 的 “。 更 糟糕 的 是 ， 他 们 
出， 没有 单个 的 解决 方法 : 


“寻找 “圣杯 ”是 徒劳 的 ， 单 个 的 、 简 单 易 用 的 、 普 遍 舌 用 的 、 使 用 起 来 可 以 方便 
地 (和 不 同方 法 ) 做 比较 的 度量 方法 ， 根 本 不 存在 。” 


此 外 , 不 同 的 作者 使 用 完全 不 同 的 统计 分 析 法 , 没有 一 个 方法 被 广泛 地 接受 为 “最 强 有 力 的 ” 
方法 。 
O Demsar 记 录 了 在 一 个 著名 国际 会 议 上 看 到 的 巨大 数量 的 统计 方法 ， 那 个 会 议 专注 的 是 从 
数据 中 学 习 经 验 教训 5 。 
口 Cohen 讨 论 了 使 用 标准 统计 假设 测试 来 做 科学 结论 的 方法 。 他 尖 刻 地 描述 这 种 测试 是 “有 
力 但 毫 无 结果 地 起 平 了 智力 成 果 ， 剩 不 下 任何 可 生长 的 科学 种 子 ”。" 
为 了 支持 Cohen 的 论题 ， 我 们 再 列举 一 个 有 益 的 教训 。 在 营销 领域 中 ，Armstrongl"1 使 用 显著 























4 第 1 章 探寻 有 力 的 证 据 


性 测试 复查 了 一 个 研究 , 该 研究 的 结论 指出 ， 从 多 样本 来 源 产 生 的 估计 并 不 比 单 样 本 来 源 产 生 的 
估计 要 好 。 他 通过 列 出 了 31 项 研究 结 末 推翻 了 这 个 结论 。 在 这 31 项 研究 中 ， 多 样本 来 源 预 测 的 效 
来 始终 超过 单 样 本 来 源 预 测 3.4% ~ 23.4% (平均 12.5%)。 在 Armstrong 的 每 项 调查 中 ,这 些 超越 都 
与 显著 性 测试 所 预计 的 结 琳 正好 相反 。 

基于 这 些 发 现 , 我 们 改变 了 对 统计 分 析 的 看 法 。 现在 我 们 会 尽 可 能 使 用 人 简洁 的 可 视 化 方法 来 
给 出 论点 ， 并 且 把 统计 的 显著 性 测试 降级 至 “合理 性 测试 ”的 角色 , 来 验证 从 可 视 化 方法 中 做 出 
的 结论 )。” 


1.2.3 结果 可 复制 性 的 挑战 

可 复制 性 已 被 证 明 是 一 个 很 难 提 摸 的 目标 。 在 某 些 主题 上 ,很 少 有 证 据 证 明 一 个 项 目的 结果 
已 经 或 者 可 以 被 推 而 广 之 。 

O Zimmermann 研 究 了 629 对 软件 开发 项 目 E5 1 。 在 只 有 4% 的 情况 中 ， 从 一 个 项 目 中 习 得 的 缺 

陷 预 测 模型 对 另 一 个 有 用 。 
O Kitchenham 等 人 的 一 项 调查 声称 第 一 个 项 目的 数据 对 第 二 个 项 目的 工作 量 估计 是 有 用 的 59。 
但 他 们 发 现 现 有 的 证 据 没 有 说 服 力 ， 甚 至 是 自 相 了 矛盾 的 。 
在 其 他 主题 上 ， 我 们 可 以 发 现 特定 现象 对 不 同 环境 都 奏效 的 证 据 。 比 如 ， 像 软件 检查 这 样 成 
熟 的 技术 可 以 找到 软件 产品 中 大 量 的 现存 缺陷 上 。 然 而 ， 如 果 一 个 新 的 研究 提出 了 反面 证 据 ,， 那 
也 很 难 确定 新 的 (或 旧 的 ) 研究 是 有 缺陷 的 ， 或 者 研究 其 实 只 是 在 一 个 特殊 的 环境 下 运行 的 。 鉴 
于 软件 开发 环境 的 多 样 性 ， 两 个 结论 通常 都 是 有 可 能 的 。 
事实 上 ， 虽 然 直觉 上 我 们 可 能 愿意 相信 可 复制 的 结果 , 但 要 么 关于 特定 的 软件 工程 问题 的 研 
究 就 很 少 ， 要 么 它们 并 不 全 面 。 
作为 对 研究 匮乏 的 例证 ，Menzies 研 究 了 不 同 组 织 提 出 的 100 个 软件 质量 保证 方法 (如 
IEEE1017 和 NASAIV&V 内 标 )， 发 现 没 有 实验 能 证 明 任 何 一 个 方法 比 别 的 方法 更 划算 中 1。 
现 有 研究 不 全 面 的 例子 包括 如 下 所 列 。 
D Zannier 等 人 随机 抽取 了 所 有 ICSE 发 布 文章 中 的 5% 作 为 研究 对 象 ,ICSE 是 自 评 为 排名 第 
一 的 软件 工程 大 会 。 他 们 发 现 那 些 自称 为 “实证 ”的 文章 中 ， 只 有 极 少数 (2%) 比较 了 
不 同 研究 者 的 方法 。 

O Neto 等 人 汇报 了 一 项 ， 针 对 基于 模型 测试 (MBT) 方法 的 文献 的 调查 结果 王 。 他 们 发 现 有 
85 篇 文章 描述 了 71 个 独特 的 MBT 方 法 , 却 只 有 很 少数 的 研究 有 实验 的 部 分 。 这 显示 了 研究 
人 员 的 总 体 趋势 是 持续 创新 和 汇报 新 的 方法 ， 而 不 是 理解 可 比 的 现 有 方法 中 的 实际 利益 。 

为 了 看 看 这 些 文章 反应 的 到 底 是 一 种 个 别 情况 还 是 一 种 更 普遍 的 趋势 ， 我 们 审阅 了 所 有 
PROMISE” 大 会 上 做 过 的 关于 可 重复 软件 工程 实验 的 演讲 。 从 2005 年 起 ， 在 PROMISE 大 会 上 。 























@ 但 我 们 仍然 每 月 驶 回 大 约 两 篇 申请 杂志 发 表 的 文章， 因为 他 们 只 汇报 平均 值 结果 ， 没有 任何 平均 值 附 近 多 方差 的 
统计 上 或 可 视 化 的 表达 。 最 起 码 ， 我 们 推荐 Mann-Whitney 或 者 Wilcoxon 测 试 (分 别针 对 非 配对 结果 和 配对 结果 ) 
来 证 明明 显 不 同 的 结 末 真 的 可 能 是 不 同 的 。 

© 查看 http://promisedata.org。 


1.3 我 们 可 以 相信 的 改变 


D 一 共有 68 个 演讲 ， 其 中 48 个 尝试 了 对 旧 数据 的 新 研究 或 者 以 Zannier “的 形式 做 了 汇报 ， 
即 一 个 对 特定 项 目 生效 的 新 方法 。 

O 9 篇 文章 对 之 前 研究 结果 的 有 效 性 提出 了 质疑 (如 Menzies 的 报告 一 )。 

O 4 篇 文章 主张 软件 工程 模式 的 通用 性 是 不 可 能 的 (如 Briand 的 报告 ”) 。 

O 具有 很 少 的 研究 者 (68 个 演讲 中 的 7 个 ) 汇报 了 从 一 个 项 目 到 另外 项 目的 推广 : 

n 4 篇 文章 汇报 了 从 一 个 项 目 中 习 得 的 软件 质量 预警 名 在 一 个 新 的 项 目 中 成 功 使 用 
(如 Weyuker 等 全 和 Tosun 等 人 ”的 报告 ); 
n 3 篇 文章 举 了 特定 案例 说 明 通 用 性 是 可 行 的 (如 Boehm 的 报告 ”)。 
这 些 发 现 稍微 引起 了 我 们 的 一 些 警 惕 ， 我 们 与 欧美 领先 的 实证 软件 工程 研究 者 进行 了 讨论 。 
我 们 的 谈话 可 以 总 结 为 以 下 几 点 。 

O Vic Basili 在 过 去 30 年 中 是 实证 软件 工程 (SE) 的 先驱 。 在 断言 现在 的 实证 软件 工程 已 经 
比 20 世 纪 80 年 代 健康 许多 后 ， 他 承认 了 两 点 。 第 一 ， 迄 今 为 止 的 研究 结 来 都 是 不 全 面 的 。 
第 二 ， 几 乎 没有 例子 能 举 出 有 多 个 项 目 可 用 的 方法 一 。 

D David Budgen 和 Barbara Kitchenham 一 起 ， 是 欧洲 提倡 “ 循 证 软件 工程 ”(EBSE) 的 领军 
É o 在 EBSE 中 , 软件 工程 师 的 实践 应 该 基于 有 文献 充分 支持 的 方法 。 Budgen 和 Kitchenham 
试图 探 明 ;“ 循 证 软件 工程 古人 奋 在 实践 和 政策 上 已 经 足够 成 熟 ? ” 他们 的 回答 是 “不 ， 还 
不 是 ”: 软件 工程 领域 需要 大 幅 调 整 ， 只 有 在 那 之 后 ， 我 们 才能 证 明 研 究 结 果 是 可 以 在 不 
同 项 目 中 复制 的 趾 。 它 们 主张 软件 工程 中 不 同 的 报告 标准 ， 特 别 是 使 用 “结构 式 摘 要 ”来 
简化 对 SE 文献 的 大 规模 分 析 。 


1.3 ”我们 可 以 相信 的 改变 


24, 我 们 还 未 实现 对 精确 、 统 计 充分 、 可 复制 证 据 的 梦想 。 而 且 ， 即 使 找到 了 符合 单个 特 
征 的 证 据 ， 也 疫 有 我 们 想象 中 的 有 影响 力 。 也 许 ， 我 们 需要 重新 审视 对 “有 力 证 据 的 定义 了 。 
根据 前 几 市 的 反馈 ， 古 否 有 更 实际 的 对 有 力 证 据 的 定义 ， 以 此 油 励 研究 者 ? 

(如 来 谦虚 地 说 ) 更 可 行 的 定义 是 : 有 力 的 证 据 激 发 改变 。 我 们 猜想 ， 这 本 书 中 的 很 多 作者 
部 是 因为 看 到 真实 软件 开发 的 第 一 手 问题 和 困难 , 才 开始 了 对 有 力 证 据 的 搜寻 。 这 些 研 究 者 寻找 
的 “圣杯 ”应 该 是 那些 能 够 创造 真实 世界 进步 的 研究 结 东 。 

为 了 激发 改变 , 一 些 有 影 啊 力 的 读者 不 得 不 去 相信 证 据 。 有 一 种 处 理 不 够 严格 的 经 验 报告 或 
案例 分 析 的 方法 ， 征 对 每 件 证 据 赋 予 一 个 “信心 指数 。 这 个 指数 试图 反应 每 篇 报告 在 一 定 信心 
邯 围 内 的 位 置 ， 从 传 于 性 的 证 据 ， 或 者 说 有 问题 的 证 据 ， 到 非 稼 可 信 的 证 据 。Kitchenham 建 议 对 
系统 性 评论 和 软件 工程 研究 使 用 新 的 流程 , 而 这 样 的 评估 正 是 该 流程 的 必要 部 分 “。 在 Feldmann 
的 一 篇 文章 中 ， 也 可 以 找到 一 种 帮助 从 业者 交流 信心 指数 的 简单 刻度 。 

生成 真正 令 人 信服 的 证 据 也 需要 对 传播 结 末 的 途径 做 出 改变 。 也 许 ,， 科技 出 版 物 不 再 古 传播 
证 据 的 唯一 技术 。 现在 的 出 版 物 存在 很 多 问题 , 其 中 之 一 就 是 , 这 些 出 版 物 通常 不 提供 原始 数据 ， 
其 他 研究 者 就 不 能 重新 分 析 、 重 新 解 译 并 验证 。 男 外 ,虽然 出 版 物 的 作者 非 第 努力 地 对 背景 做 出 
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详尽 的 描述， 但 也 不 可 能 列 出 所 有 相关 因素 。 
更 有 和 希望 的 一 种 做 法 是 ， 创 造 软 件 工 程 数 据 知 识 库 ， 用 来 存储 跨 环境 的 研究 成 有 末 (至 少 是 跨 
项 目的 ) ， 然 后 可 以 从 这 个 仓库 的 数据 中 展开 分 析 。 如 下 所 示 。 


S0000000000000000000smR000° 

这 个 知识 库存 储 了 软件 相关 的 构件 , 研究 者 可 以 把 它 用 在 有 程序 分 析 和 软件 测试 技术 严 
格 控制 的 实验 法 中 。 教 师 也 可 以 用 它 在 可 探 实验 中 来 训练 学 生 。 这 个 知识 库 包含 了 很 多 Java 
和 C 的 不 同 版 本 软件 系统 ， 也 包含 了 支持 构件 ， 如 测试 套件 、 缺 陷 数 据 和 脚本 。 这 个 知识 库 
中 的 构件 已 经 在 上 百 个 出 版 物 中 被 使 用 。 


e NASAD J OU UU UU SE 
NASA 实 验 室 ( 详 见 第 5 章 ) 是 一 个 巨大 的 成 功 。 它 有 广泛 的 影响 力 ， 它 的 数据 和 结 末 
也 持续 被 ?| 用 。 有 一 个 涉及 背景 的 重要 经 验 : 实验 室 的 领导 者 要 求 想 用 他 们 数据 的 研究 者 花 
时 间 做 实验 ， 从 而 正确 理解 他 们 的 研究 背景 ， 不 曲解 他 们 的 分 析 绪 条。 
e CeBASE 
这 是 一 个 数据 和 经 验 的 知识 库 ， 由 NSE 资 助 , 用 于 与 其 他 研究 者 共享 并 重新 分 析 。 我 们 利 
用 了 SEL 的 经 验 ， 探 索 把 数据 用 较 少 的 开销 置 于 不 同 背景 的 方法 ， 如 用 一 套 丰 晤 的 元 数据 标记 
所 有 的 数据 集 ， 元 数据 拉 述 了 数据 的 出 处 。 这 些 数据 经 验 回 过 头 来 成 为 另 一 个 “经 验 教训 
知识 库 的 支柱 ， 这 个 知识 库 由 美国 国防 部 的 国防 采 办 大 学 维护 ， 可 以 让 最 终 用 户 指定 他 们 自 
己 的 背景 参数 ， 比 如 项 目的 大 小 、 重 要 性 或 者 领域 ， 以 此 找到 在 相似 环境 中 被 证 实 的 实践 。 
e PROMISE|| L 
另 一 个 活跃 的 软件 工程 知识 库 来 目 于 PROMISE 项 目 ， 这 个 项 目 在 本 草 的 前 面 也 被 ?| 用 
过 。PROMISE 探 寻 可 重复 的 软件 工程 经 验 。 这 个 项 目 分 为 三 个 部 分 。 
O 在 线 公 共 域 数据 知识 库 。 在 写 此 文 时 ， 该 知识 库 包含 91 了 个 数据 集 。 其 中 一 半 关 于 
缺陷 预警 ， 剩 余 的 数据 集 探索 了 工作 量 预 佑 、 基 于 模型 的 软件 工程 、SE 数 据 的 文本 
安 据 以 及 其 他 问题 。 
D 每 年 一 次 的 年 会 ， 强 费 喜 励 作者 不 仅 发 布 文章 ， 也 在 使 用 数据 知识 库 做 出 他 们 的 结 
论 后 ， 为 知识 库 做 贡献 。 
口 特别 期 刊 ， 发 表 年 会 中 最 好 的 文章 。” 
知识 库 在 提供 链接 至 数据 页 献 者 时 特别 有 用 。 我 们 必须 承认 ,数据 很 少 独立 存在 。 作 者 应 该 
把 回答 问题 以 及 与 试图 解读 他 们 工作 的 人 对 话 视 为 稼 态 , 而 非 反 第 情况 。 这 种 接触 对 理解 得 出 数 
据 的 背景 很 重要 。 也 能 帮助 用 户 找到 与 他 们 的 问题 和 他 们 的 环境 最 相关 的 数据 。 巴 尔 的 摩 市 马里 
兰 大 学 (UMBC) 的 Gunes Koru 在 PROMISE 的 一 些 数据 集中 找到 了 一 个 系统 错误 。 他 通过 
PROMISE 知 识 库 附属 的 博客 软件 张贴 了 这 个 错误 。 然后 , 通过 PROMISE 的 博客 ， 他 联系 到 了 原 
始 数据 的 制造 者 ， 这 些 制 造 者 对 这 些 错误 的 原因 以 及 避免 方法 提供 了 大 量 的 评论 。 
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1.4 BRA ei 


PROMISE 这 样 的 知识 库 虽然 古 找 到 有 推动 性 和 有 说 服 力 证 据 的 必要 因素 ,但 它们 也 只 古 解 
决 方法 的 一 部 分 。 我 们 在 之 前 草 贡 中 摘 述 了 为 什么 证 据 的 收集 总 是 与 上 下 文 相关 的 。 节 近 我 们 开 
人 认识 到 ， 解 读 证 据 也 是 与 上 下 文 相关 的 ， 其 至 古 与 读者 相关 的 。 为 了 更 好 地 认识 这 个 问题 , 我 
们 知 要 离 题 一 会 ， 去 讨论 一 扩 理 论 。 

许多 软件 工程 的 问题 存在 于 一 个 解 空 间 内 , 这 个 解 空间 就 像 随 意 扔 在 地 板 上 的 地 禾 一 般 任意 
扭曲 。 想 象 一 个 蚂蚁 正 在 搜寻 这 块 地 毯 的 高 峰 和 低 合 ， 试 图 找到 最 低 点 ， 比 如 在 这 个 点 上 ， 软 件 
开发 的 工作 量 和 缺陷 的 数量 最 少 。 

如 末 问 题 足够 复杂 (软件 设计 和 软件 流程 的 决定 也 确实 非常 复杂 )， 就 不 存在 找到 最 佳 解决 
方案 的 最 佳 途径 。 也 就 是 说 ， 蚂 蚁 可 能 被 困 在 错误 的 低谷 中 ， 自 认为 是 最 低 其 实 却 不 是 (比如 ， 
一 些 山 硝 阻碍 了 它 的 视线 ， 使 之 看 不 见 相 邻 的 更 低 合 )。 

优化 算法 和 人 工 智 能 算法 使 用 各 种 试探 性 方法 来 搜索 这 个 选择 空间 。 一 种 方法 是 根据 特定 
观众 的 目标 对 问题 的 上 下 文 建 模 ， 然 后 把 搜索 引导 至 一 个 特定 的 方向 。 想 象 那 只 蚂蚁 在 一 根 皮 
汕 上 ， 而 这 根 皮 市 向 着 目标 方法 被 轻 轻 地 拉动 。 

现在 ， 令 人 吃 恢 的 来 了 。 这 些 试探 性 搜索 方法 虽然 有 用 ， 但 却 对 研究 结 东 施加 了 一 个 侦 差 。 
如 条 你 改变 上 下 文 ， 也 改变 了 偏差 ， 那 这 些 算 法 就 会 找到 不 同 的 “最 佳 ” 方 案 。 例 如 ， 在 对 软件 
过 程 模 型 的 人 工 智能 搜索 实验 中 ，Green 等 人 使 用 了 两 种 不 同 的 目标 函数 。 一 个 目标 代表 了 安 
全 性 至 关 重 要 的 政府 项 目 , 试图 同时 减少 开发 工作 量 和 软件 交付 的 缺陷 数 。 男 一 个 目标 代表 了 更 
标准 的 商业 情况 ,急于 发 布 软件 至 市 场 ， 并 一 直 努 力 不 要 插入 过 多 缺陷 。 此 研究 用 人 工 智能 优化 
arias 了 4 个 不 同 项 目 。 每 次 搜索 在 每 个 目标 下 重复 。 一 个 恢 人 的 结 来 是 ， 一 个 目标 产 出 的 建议 
通 第 在 另 一 个 目标 下 会 被 否决 。 比 如 ,使 用 一 个 目标 的 人 工 智能 搜索 推荐 增加 交付 前 的 时 间 ， 而 
另 一 个 则 建议 减少 时 间 。 

对 任何 试图 找到 证 据 来 说 服 人 们 改变 现 有 软件 开发 流程 和 工具 的 人 来 说 , 这 个 结 末 部 有 重要 
意义 。 我 们 需要 根据 观众 调整 证 据 ， 而 不 是 假设 所 有 证 据 都 能 说 服 所 有 人 。 站 在 台 上 像 变 戏法 似 
的 拿 出 看 似 动人 的 证 据 并 不 足够 。 即 使 古 从 精确 研究 中 取得 的 有 统计 强度 的 、 可 复制 的 证 据 ， 如 
林 证 据 与 观众 问题 不 相关 ， 那 也 不 能 向 发 任何 改变 。 换 句 话 说 ， 观 众 可 能 会 目 同 :“ 这 到 后 有 什 
么 好 处 ? “而 我 们 需要 章 重 他 们 的 “业务 偏差 。 


1.5 ”展望 未 来 


虽然 软件 工程 研究 已 经 进行 了 几 十 年 , 但 是 至 今 我 们 只 看 到 了 极 少 的 有 力 证 据 , 能 引导 软件 
项 目 运 行 方式 的 改变 。 我 们 推测 这 是 由 于 背景 的 问题 : 研究 者 制造 了 关于 A 的 证 据 ， 而 观众 却 关 
注 B、C、D 等 。 我 们 推荐 研究 者 在 搜寻 软件 工程 证 据 时 多 一 点 谦 蛙 ， 至 少 和 现在 持平 ， 并 愿意 结 
识 并 倾听 软件 从 业者 ， 他 们 可 以 帮助 我 们 更 好 地 领会 B、C、D 究 竟 征 什么 。 我 党 得 我 们 的 领域 需 
要 在 至 少 一 段 时 间 内 ,停止 搜寻 对 所 有 项 目 所 有 情况 都 适用 的 结 末 的 证 据 ， 找 到 有 影响 力 的 局 部 
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结果 已 经 足够 有 挑战 性 了 。 
Endres 和 Rombach 提 出 了 一 个 ， 关 于 如 何 构建 软件 和 系统 工程 知识 的 观点 … 。 
O 在 特定 环境 下 对 实际 开发 工作 进行 观察 ， 这 在 任何 时 候 都 能 进行 。(“ 观 察 ” 在 这 里 的 定 
义 同 时 包含 铁 的 事实 和 主观 印象 。) 

O 重复 的 观察 会 引出 一 些 规则 ， 帮 助理 解 事情 将 可 能 会 如 何 发 生 。 

O 规则 可 以 被 理论 所 解释 ， 解 释 为 什么 这 些 事件 发 生 了 。 

鉴于 当前 经 验 性 研究 处 理 问 题 的 复杂 性 ,我 们 不 应 该 急于 进行 理论 建设 。 一 个 更 多 产 的 知识 
构建 模型 基于 我 们 现在 看 到 的 所 有 数据 和 研究 , 是 一 种 “观察 ”和 “规则 ”的 双 层 方法 (使 用 Endres 
的 术语 )， 由 我 们 之 前 描述 的 知识 库 来 支撑 。 

对 第 一 层 来 说 , 研究 者 会 对 局 部 观众 的 目标 建 模 ， 然 后 收集 关注 这 些 目 标的 证 据 。 已 有 的 现 
代 化 数据 挖掘 工具 ?， 可 以 帮助 工程 师 们 学 习 局 部 的 经 验 教 训 。 

在 第 二 层 中 , 我 们 把 不 同 项 目 和 不 同 背 景 的 结论 抽象 出 来 。 现 在 可 能 必须 满足 于 只 在 一 个 领 
域 中 抽象 出 重要 因素 或 基本 原则 , 而 不 是 提供 “唯一 ”的 解决 方法 对 所 有 不 同 背 景 的 子 集 都 适用 。 

比如 ，Hall 等 人 试图 回答 什么 能 激励 软件 开发 者 。…“ 他 们 查看 了 92 个 实验 过 此 问题 的 研究 ， 
每 个 都 有 不 同 的 背景 。 在 试 着 和 弄 清 楚 这 些 研究 和 它们 的 不 同 研究 结果 时 ,研究 者 在 寻找 看 似 能 激 
励 开 发 人 员 的 因素 ， 即 使 不 太 可 能 量化 这 些 因 素 的 贡献 。 于 是 ,伴随 着 一 定 的 可 信 度 ， 在 多 个 研 
究 中 所 找到 的 有 作用 的 激励 因素 被 包含 在 这 个 模式 中 。 

最 终结 果 不 是 一 个 预言 性 的 模型 ， 如 X 因 素 是 Y 因 素 重 要 性 的 两 倍 。 相 反 ， 它 是 一 个 重要 因 
素 的 列表 ， 管 理 者 可 以 在 自己 的 环境 中 用 它 来 确保 他 们 没有 忽视 或 扎 记 某 些 东西 。 也 许 , 在 许多 
问题 上 ， 我 们 能 做 到 的 最 好 情况 是 ， 提 供需 要 考虑 的 因素 来 装备 那些 带 着 问题 的 从 业者 ， 让 他 们 
找到 自己 问题 的 解决 方案 。 

要 做 到 这 点 , 我 们 需要 扩大 第 一 层 观 窦 所 能 接受 的 “证 据 ” 的 定义 。 一些 研究 者 一 直 争 论说 ， 
软件 工程 研究 存在 对 定量 数据 和 研究 的 偏好 , 而 定量 的 工作 也 可 以 同样 严格 并 提供 对 相关 问题 的 
AAEH, 构建 更 强大 证 据 集 合 的 开始 ， 是 真正 拓展 可 接受 证 据 的 定义 ,以 此 混合 定性 和 定量 
的 资源 。 也 就 是 说 ， 更 多 关于 技术 为 什么 能 行 或 者 为 什么 不 行 的 文本 或 图 片 数据 ， 以 及 技术 影响 
力 多 少 的 定量 数据 。 

然而 ,真正 有 影响 力 的 证 据 实 体 走 得 更 远 ， 并 且 接 收 完全 不 同 种 类 的 证 据 。 不 止 是 试图 找到 
具有 统计 意义 的 研究 , 也 包含 能 提供 更 多 关于 技术 实践 应 用 信息 的 调查 经 验 汇 报 。 这 种 经 验 汇 报 
目前 被 低估 了 ， 因 为 它们 被 认为 不 如 现 有 的 文献 严格 。 比 如 ,不 总 能 确保 各 方面 利益 都 被 精确 衡 
量 , 不 能 保证 混淆 的 因素 已 经 排除 ,或 者 不 能 证 明 流 程 一 致 性 因素 已 经 避免 。 然 而 ， 这些 报告 应 
该 是 任何 软件 开发 技术 “证 据 线 索 ” 的 一 个 显而易见 的 部 分 。 

正如 Andres 把 “观察 ”定义 地 足够 广泛 来 包含 主观 印象 ， 如 果 我 们 不 根据 他 们 的 标记 去 创建 
无 根据 的 规则 ,即使 不 那么 严格 的 输入 模式 也 可 以 帮助 我 们 找到 有 效 的 结论 。 对 这 些 证 据 源 赋予 
信心 指数 非常 重要 ， 这 样 ， 方 法 论 的 问题 就 可 以 被 凸显 出 来 。( 当 然 ， 即 使 最 严格 的 研究 也 不 会 
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完全 没有 任何 方法 论 的 问题 。) 
经 验 访 报 可 以 通过 证 明 实践 约束 下 达成 的 结 霖 不 总 是 与 我 们 对 给 定 技 术 的 期 望 相 匹 配 , 从 而 
使 研究 有 根 有 据 。 同 样 重要 的 是 ,他们 对 于 需要 如 何况 裁 或 修改 技术 来 应 对 日 第 软件 开发 的 实践 
约束 扣 供 了 见解 。 在 技术 转移 领域 , BT ZB ACBL, 一 个 描述 技术 在 实践 中 正面 经 验 的 案例 分 析 ， 
对 从 业者 来 说 ， 比 大 量 额 外 的 研究 报告 更 有 价值 。 如 此 令 人 信服 的 证 据 体 ， 也 能 通过 提供 对 不 同 
用 户 有 用 的 证 据 来 帮助 3| 导 改变 。Rogers 提 出 了 一 个 经 党 被 引用 的 模型 ， 用 钟 形 曲 线 刻 画 了 一 些 
创新 产品 (如 人 研究 结果 ) 的 消费 者 : 最 左边 的 尾巴 包含 了 创新 者 ， 钟 形 的 突出 部 分 代表 了 大 多 数 
人 ,他 们 随 着 这 个 创新 想法 逐渐 流行 而 采纳 ,最 右边 的 尾巴 包含 了 抵触 改变 的 落后 者 TRA 
己 观 众 的 研究 者 能 从 真正 健壮 的 数据 集中 选择 适当 的 子 集 来 构建 他 们 的 熔 例 。 
O 早期 采纳 者 可 能 找到 的 是 包含 相对 低 可 信 度 的 可 行 性 研究 的 一 个 小 集合 ， 或 者 一 到 两 个 
“精确 ”人 研究 ， 这 已 经 足够 使 他 们 采纳 改变 。 特 别 是 当 这 些 研 究 的 背景 显示 出 证 据 是 在 一 
个 与 他 们 相似 的 环境 中 收集 的 。 

口 大 部 分 采纳 者 需要 看 到 不 同上 下 文中 的 多 样 研 究 ， 才 会 相信 研究 的 想法 征 有 价值 的 ， 被 
证 实 不 止 在 一 个 合适 的 环境 中 可 行 ， 并 且 已 经 开始 成 为 被 部 分 接受 的 行事 方式 。 

落后 者 或 者 后 期 采纳 者 可 能 需要 压倒 性 的 证 据 , 这 可 能 包括 大 量 的 高 可 信和 度 研 究 ， 以 及 在 大 
TOE ATA) ioe Pr BAIA ea A 

BIEL Fi HOR eS EY A OE, 但 最 重要 的 是 , 定性 报告 和 定量 数据 之 
站 的 相互 影响 。 我 们 经 常 看 到 从 业者 在 混合 不 同 数据 类 型 的 数据 集 后 收 到 更 好 的 效 末 。 例 如 ， 
一 个 同时 包含 硬 数 据 和 真实 团队 正面 经 验 的 丰富 集合 ， 帮 助 了 软件 检查 技术 在 不 同 NASA 中 心 
的 散播 ”。 

从 民 好 设计 的 经 验 性 研究 中 得 出 的 证 据 可 以 帮助 结 来 达到 统计 音义， 但 实施 可 能 仍然 不 切 
实际 ， 或 者 不 能 及 时 回答 新 问题 (特别 在 技术 快速 改变 的 领域 ,如 软件 工程 )。 实 际 运用 中 的 证 
据 可 能 对 益处 更 有 说 服 力 ， 但 是 通 和 党 不 太 严 格 。 经 第 需 要 同时 结合 两 种 证 据 ， 相 互 巩固 ， 才 会 
了 最 有 具 说 服 力 。 
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作为 软件 工程 师 ， 我 们 对 什么 起 作用 、 什 么 不 起 作用 或 者 不 太 起 作用 都 有 各 目的 意见 。 我 们 
因此 共享 实践 故事 和 经 验 ， 它 们 了 最 终 化 作文 化 知识 和 各 种 常识 。 但 问题 征 ，“ 地 球 人 都 知道 的 东 
西 ” 和 前 前 是 错 的 。 虽 然 我 们 不 断 收 集 信 息 ， 但 是 也 许 并 未 细致 惟 确 地 评 佑 并 鳌 合 那些 信息 ， 甚 至 
都 没有 必要 的 手段 来 这 人 么 做 。 


2.1 软件 工程 中 的 证 据 是 如 何 发 现 的 


在 侦探 万 中 ,新 证 据 出 现 的 时 刻 通 笛 是 最 有 趣 的 : 茶 个 人 提供 了 之 前 不 为 人 知 的 事实 ， 然 后 
聪明 的 侦探 调整 了 他 的 犯罪 推理 。 有 时 ， 新 的 证 据 为 我 们 的 世界 观 加 入 了 一 个 重要 维度 “HR, 
原来 他 预谋 了 所 有 这 些 事情 ! ”) ; 有时， 它 只 是 让 我 们 更 加 坚信 自己 的 想法 (“她 确实 不 像 她 
说 的 那么 仔细 ”) ， 有 时 ， 它 会 颠覆 我 们 之 前 认为 很 可 靠 的 东西 “天 哪 ! 我 一 直 以 为 他 比 她 晚 
到 了 一 小 时 ! ”) 。 故 事情 区 取决 于 侦探 的 判断 性 思维 能 力 。 小 说 里 的 早 越 侦探 们 会 把 所 有 和 零 旦 
的 证 据 列 入 芳 虑 范围 内 , 不 把 所 有 证 据 结 合成 一 个 整体 不 村 手 , 然后 不 断 地 调 试 他 们 的 犯 徘 推理 ， 
一 旦 看 到 新 证 据 就 会 相应 调整 。 然 而 一 个 差 的 侦探 则 会 执著 于 确认 式 偏见 ， 即 使 他 们 不 能 说 明 
证 据 中 的 剩余 疑点 ， 也 会 坚守 目 己 的 推理 。 

软件 开发 也 类 似 : 证 据 随 着 时 间 的 推移 不 断 出 现 ， 而 工程 的 质量 则 取决 于 工程 师 的 判断 能 
力 。 如 琳 我 们 届 服 于 确认 式 偏 见 ， 那 么 我 们 就 会 把 大 部 分 注意 力 集中 到 巩固 我 们 目 己 观 皇 的 证 
据 中 。 如 条 我 们 能 更 警 览 一 些 ， 有 时 就 会 找到 新 的 信息 ， 提 醒 我 们 之 前 忽视 了 未 些 方面 ， 应 该 
把 它 放 入 全 局 芳 夸 。 也 许 ， 我 们 莫 至 能 发 现 订 个 深入 人 心 的 信念 其 实 征 与 事实 相 和 韦 盾 的 。 

相关 的 新 信息 从 哪里 来 呢 ? 有 以 下 多 种 渠道 。 














O 确认 式 偏见 (confirmatory bias) : 指 人 们 倾向 于 采纳 支持 自己 的 设想 或 者 预期 的 证 据 ， 而 不 管 这 些 证 据 是 否 真 实 。 
-RRE 
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e HU 
软件 工程 师 通过 不 断 使 用 技术 和 方法 、 参 与 项 目 来 学 习 新 东西 。 
$ | | 
软件 工程 师 与 认识 的 人 交谈 ， 并 倾听 他 们 草 敬 的 人 给 的 建议 。 
“CEEE 
tH AIRE LINAS Een A, BA REE NAT 
a OE 


书面 材料 ， 无论 是 非 正式 的 (如 高 质量 的 博客 文章 ) 还 契 正 式 的 〈 如 科技 文章 ) 都 传输 
了 其 他 各 方 的 见解 。 
e 00000000L 

软件 工程 师 进 行 软件 实验 、 着 手 用 户 研 究 并 对 各 种 选择 开展 系统 性 比较 。 


并 不 是 所 有 人 都 认为 软件 工程 擎 握 了 足够 的 证 据 。 已 经 有 一 些 人 呼吁 “ 循 证 软件 工程 
(evidence-based software engineering， 如 Finkelstein5 和 Kitchenham 等 人 的 文章 ) 的 方法 ， 即 整 
合 实证 研究 的 结果 提供 技能 、 习 惯 和 基础 ， 以 便 支 持 软件 工程 的 决策 。 我 们 通 第 会 拿 软 件 工程 与 
循 证 医学 及 其 对 严格 临床 证 据 的 依赖 做 比较 。 我 们 的 目的 不 是 为 了 证 明 软 件 工 程 忽视 了 证 据 〈 虽 
然 基 于 有 和 争议 观点 和 迷信 的 软件 工程 无 疑 仍 然 存 在 )”  ， 而 是 为 了 说 明 我 们 的 学 科 缺 乏 一 个 组 织 、 
文化 和 技术 基础 ， 以 支持 对 不 同 渠 道 知 识 的 聚集 和 整合 。Barbara Kitchenham 在 第 3 章 中 介绍 了 这 
项 运动 。 

我 们 还 可 以 看 到 其 他 一 些 对 软件 工程 的 思 芳 和 反省 ， 用 来 改善 软件 工程 实践 的 例子 。 比 如 
Fred Brooks 和 Walter Vincenti 这 样 的 作家 ， 通 过 提取 经 验 并 使 用 从 实践 和 经 验 中 来 的 例证 来 关注 
实践 ， 以 此 思 芳 工程 活动 的 本 质 。 我 们 不 会 仅仅 因为 他 们 的 论文 基于 的 不 是 科学 实验 而 是 反思 经 
验 ， 就 抵制 他 们 的 重要 性 。 但 是 我 们 会 仔细 思考 他 们 的 结论 : 我 们 是 否 同意 这 些 结论 ， 这 些 结论 
合适 合 我 们 的 环境 ， 是 否 与 我 们 的 经 验 匹 配 。 也 就 是 说 ， 它 们 是 否 与 我 们 熟悉 的 证 据 相 一 致 。 

但 不 论 我 们 依 徘 的 是 科学 研究 (剩余 章 市 都 会 关注 于 此 ) ， 还 是 开明 人 士 的 报告 , 我 们 认为 ， 
作为 一 个 软件 工程 师 ， 需 要 对 证 据 有 十 分 精确 的 理解 ， 才 能 帮助 我 们 做 出 正确 的 决定 ， 才 能 根据 
我 们 想 问 的 问题 来 评估 对 证 据 的 需求 。 我 们 本 质 上 并 不 需要 更 多 的 指标 ， 或 是 广泛 使 用 的 科学 方 
法 ， 也 不 需要 死板 的 方法 论 和 教科 书 似 的 说 教 。 强 加 的 流程 和 方法 本 丑 不 能 产 出 质量 ， 当 然 也 不 
能 保证 质量 。 然 而 ,我 们 通 第 试图 用 这 些 方 法 来 达到 真正 的 目标 : 系统 性 的 、 博 识 的 、 循 证 的 批 
判 性 思维 。 

这 个 讨论 的 实质 是 让 大 家 对 证 据 有 更 多 的 思 芳 : 我 们 如 何 根 据 可 信 度 和 对 目的 的 适用 度 来 评 
估 证 据 。 


22 ”可 信和 度 和 适用 性 
我 们 的 讨论 围绕 着 两 个 主要 概念 展开 ， 可 信 度 和 适用 性 。 

















日 
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< ON 
你 愿意 〈 或 应 该 ) 从 多 大 程度 上 相信 所 提供 的 证 据 及 其 相关 断言 。 可 信和 度 包 括 有 效 性 ， 
即 研究 及 其 断言 在 多 大 程度 上 能 准确 拉 述 所 关心 的 现象 。 有 效 性 有 如 下 几 个 方面 。 


O 你 所 观察 到 的 古 不 古 你 想 要 观察 到 的 ， 是 不 是 你 完 得 正在 观察 到 的 ， 
口 所 使 用 的 度量 是 否 真正 度量 了 和 而 望 度量 的 东西 ， 
口 是 奋 准 确 解 释 了 发 生 事件 的 原因 ， 
O 我 们 是 否 能 把 已 经 研究 过 的 东西 推广 到 概念 上 可 比较 的 其 他 环境 中 。 
可 信和 度 需要 一 项 研究 来 体现 高 度 有 效 性 , 不 仅 如 此 , 也 需要 良好 的 报告 让 读者 知道 在 什么 时 
候 如 何 应 用 这 项 研究 。 

e O00 

在 多 大 程度 上 你 对 证 据 及 其 断言 感 兴趣 (或 应 该 感 兴 趣 ) 。 在 大 多 数 情况 下 ， 你 看 都 不 
会 看 那些 不 相关 的 研究 。 但 有 种 典型 的 例外 : 你 对 问题 感 兴趣 ， 但 是 找到 答案 的 环境 却 和 你 
的 大 相 径 庭 。 在 那 种 情况 下 , 适用 性 指 的 是 在 多 大 程度 上 你 可 以 把 研究 结 末 推广 到 你 自己 的 
环境 中 。 不 苹 的 征 ， 这 通 前 征 个 很 难 回答 的 问题 。 有 人 把 适用 性 看 做 可 信 度 的 一 个 方面 ,但 
我 们 相信 把 它们 分 开 看 待 会 有 所 帮助 。 因 为 低 可 信和 度 的 陈述 相当 于 吕 声 《假设 你 还 想 要 了 解 
无 数 东西 ) ， 而 高 可 信和 度 低 适 用 性 的 陈述 是 高 质量 的 信息 ， 只 不 过 你 目前 不 觉得 对 你 非常 重 
要 。 但 情况 是 会 变 的 。 


2.2.1 适用 性 ， 为 什么 使 你 信服 的 证 据 不 能 使 我 信服 


证 据 不 是 证 明 。 总 的 说 来 ,任何 足以 让 我 们 认为 一 个 理由 可 信 , 或 者 比 男 一 个 理由 更 可 信 的 
实证 就 是 证 据 。 不 同 的 目的 需要 不 同 标准 的 证 据 。 有些 目的 需要 强 有 力 的 证 据 。 比 如 说 ， 决 定 是 
人 否 要 把 所 有 的 软件 开发 都 转换 成 面 癌 方面 的 设计 和 实现 , 这 需要 非 党 有 说 服 力 的 证 据 来 证 明 收 益 
大 于 投资 (包括 经 济 和 文化 方面 ) 。 有 些 目 的 只 需要 湾 弱 的 证 据 妈 可。 比如 说 ， 一 个 面 同 方面 的 
追踪 应 用 实例 可 能 已 经 足够 证 明 面 向 方面 的 编程 方法 (AOP) 是 有 价值 的 ， 留 待 进一步 研究 来 证 
清 的 是 它 能 (在 什么 环境 下 ) 多 好 地 完成 目标 。 一 份 以 找 出 设计 中 的 缺陷 为 目标 的 评估 研究 ， 可 
能 只 需要 少数 参与 者 的 回复 。 我 们 知道 有 一 个 为 制造 业 所 设计 的 语音 反馈 系统 原型 ,在 初始 用 户 
外 出 他 们 用 耳塞 就 能 屏 散 工厂 噪声 之 后 就 被 放弃 了 。 一些 目的 只 需要 反例 就 够 了 。 比 如 ， 当 一 个 
人 试图 辩驳 一 项 假设 或 者 一 项 普 适 的 断言 时 ， 他 只 需要 一 个 反例 。 例 如 ， 可 视 化 编程 的 支持 者 们 
声称 “可 以 图 形 化 的 就 是 好 的 ”, 但 是 通过 在 一 项 实验 中 证 明 骨 僚 结 构 在 用 文本 表示 时 理解 起 来 
更 快 ， 使 得 这 些 支 持 者 们 开始 重新 审视 他 们 的 看 法 。 

所 以 ,你 想 问 的 回 题 和 特定 环境 下 需要 的 证 据 之 间 是 有 联系 的 。 你 需要 的 证 据 和 能 提供 那些 
证 据 的 方法 之 间 也 是 有 联系 的 。 比 如 说 ,你 不 能 向 提供 信息 的 人 询问 不 能 说 的 秘密 ， 这 就 是 调查 
的 局 限 性 之 一 。 软 件 是 创建 并 部 署 在 社会 技术 背景 (socio-technical context) 之 下 的 ， 所 以 关于 
软件 的 断言 和 论点 需要 同时 借鉴 考虑 了 社会 和 技术 背景 的 证 据 以 及 包含 两 者 之 间 关 系 的 证 据 。 

例如 , 理解 面 癌 方面 的 设计 对 你 项 目的 沟通 结构 所 产生 的 影响 ,需要 先 观察 那 项 技术 的 整个 
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应 用 场景 。 对 方法 的 展 好 应 用 意味 着 “对 症 下 药 “， 也 意味 着 合理 使 用 那些 和 问题 相关 并 且 服 务 
于 目的 的 证 据 。 


2.2.2 ”定性 证 据 对 战 定 量 证 据 : 错误 的 二 分 法 


研究 中 的 讨论 通 第 把 定性 研究 和 定量 研究 区 分 开 来 ,概括 来 说 , 区别 存 在 于 所 关注 的 问题 中 。 
定量 研究 围绕 度量 展开 ， 通 第 见 到 的 有 比较 问题 ( A 比 B 快 吗 ? “)、 假 设 问题 ( 如 条 A 改 变 了 ， 
B 会 改变 吗 ?“) 和 多 少 问题 (“开发 人 员 花 了 多 少时 间 调 试 ?“) 。 相 反 ， 定 性 研究 围绕 摘 述 和 分 
类 展开 ,通常 会 同 为 什么 (“A 为 什么 比 B 学 起 来 容易 ?“) 或 者 怎样 (“开发 人 员 用 什么 方法 怎样 
处 理 调试 ?“) 。 
如 大 部 分 模型 一 样 ， 这 只 是 个 人 简化。 一些 关于 概念 上 的 区 分 会 导致 混乱 ,需要 一 些 简 短 的 讨 
论 来 证 请 。 
*HUUHUUUHUUHUUUUUUUUUUUUUUUUUUUUOY 
两 种 证 据 有 不 同 的 目的 , 因此 不 能 直接 比较 。 定 性 证 据 用 来 确定 所 关心 的 现象 并 解 开 已 
知 所 关注 的 费解 现象 。 定量 证 据 是 为 已 确定 的 现象 准备 的 , 这 些 现象 要 么 已 经 被 理解 得 足够 
好 ， 要 么 足够 简单 而 能 被 独立 研究 。 
因此 , 定性 研究 应 该 在 定量 研究 之 前 开展 ， 碍 看 那些 更 复杂 的 情况 。 当 只 涉及 少数 不 同 
因素 时 (如 物理 学 )， 就 可 以 快速 推进 至 定量 研究 了 ; 当 涉 及 许多 不 同 因素 时 (如 人 类 社会 
互动 ) ,这 种 转换 要 么 需要 更 长 的 时 间 ， 要 么 需要 利用 尚 不 成 熟 的 人 简化。 软件 工程 证 据 中 许 
多 可 信和 度 的 问题 都 来 目 于 这 种 不 成 熟 的 向 化 。 
e 0000000000 
FE VERN ED Bere (CP AES. EER H em EM RE EEN He (如 言论 或 
行动 的 记录 )， 然 后 把 数据 进行 系统 化 编码 (如 数据 分 类 )， 最 终 量化 编码 数据 (就 是 计算 每 
个 分 类 中 的 实例 ) 并 进行 统计 分 析 。 定 量 研究 反 过 来 也 可 能 有 定性 的 因素 存在 。 例 如 ， 当 比 
较 两 种 方法 A 和 B 的 功效 时 ， 可 能 会 比较 两 种 方法 的 产品 ， 把 它们 评估 为 “好 、 不错- 
和 “ 差 ”。 这 些 回答 是 定性 的 ， 它 们 落 在 顺序 量 表 上 上。 然而， 可 以 继续 使 用 统计 方法 〈 如 
Wilcoxon 秩 和 检验 ) 来 确定 A 的 输出 是 否 显 车 地 比 B 的 输出 好 。 研 究 结构 是 实验 性 的 ， 而 分 
析 是 定量 的 , 和 度量 单位 古 厘米 或 秒 用 的 是 同样 的 技巧 。( 即 使 在 使 用 性 能 指标 的 研究 中 , 对 
指标 的 选择 以 及 指标 和 质量 的 联系 也 可 能 是 基于 定性 评估 的 。) 
软件 系统 中 最 有 力 的 研究 结合 了 定量 证 据 (如 性 能 度量 ) 和 定性 证 据 (如 流程 描述 ) 来 
记录 现象 ， 识 别 关 键 因 素 ， 并 为 现象 和 因素 之 则 的 关系 提供 有 根据 的 解释 。 
e 0000000“ U0 0000000000 UU "UO 
优质 研究 的 结果 绝 不 会 是 武断 的 。 好 的 科学 寻求 可 重 现 的 (“人 硬 的 ”) 结 末 ,因为 可 重 现 
的 结 采 意味 着 它 是 可 靠 的 ,而 且 重 现 的 过 程 使 研 完 方法 接受 严格 的 审 碍 。 重 现 结 朱 意味 着 重 
Ri”) 各 自 的 研究 ， 要 么 在 几乎 完全 相同 的 情况 下 (紧密 复制 )， 要 么 在 不 同 但 是 想 
法 类 似 的 方式 下 (宽松 复制 ) 。 定 性 研究 几乎 总 是 涉及 独特 的 人 文 至 景 , 因此 很 难 紧密 复制 。 
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然而 ， 那 不 意味 着 人 研究 结果 不 能 重 现 ; 这 通 第 是 可 能 的 。 从 相关 性 的 角度 来 说 ,宽松 复制 比 
紧密 复制 更 有 价值 ， 因 为 这 苇 味 着 结 来 更 具 普 及 性 。 从 男 一 个 角度 来 说 ,定量 研究 的 结 末 有 
时 不 能 重 现 。 比 如 ，John Daly 对 继承 次 度 的 研究 被 三 个 不 同 的 研究 组 复制 ,得 出 了 相互 矛盾 
的 结果 。 


总 结 而 言 ， 定量 研 究 的 优势 是 用 几 句 简单 的 陈述 就 能 摘 述 情况 ， 因 此 ， 有 时 能 把 事情 弄 得 很 
清楚 ,它们 的 劣势 古 忽 视 了 太 多 的 信息 ,以 至 于 通 芝 很 难 确定 结 末 真 正堂 味 着 什么 以 及 何 时 适用 。 
定性 研究 的 长 处 是 它们 的 结 霖 反映 并 展示 了 真实 世界 的 复 淋 度 。 劣 势 是 它们 因此 更 难 评 估 。 如 来 
不 清楚 如 何 把 研究 结 霖 映 映 到 真实 世界 的 环境 下 ,任何 研究 都 难以 应 用 于 真实 生活 , 或 是 因为 实 
验 记 围 太 过 狭 罕 ， 无 法 普及 ， 或 是 因为 观测 的 背景 太 过 不 同 。 

“ 抵 线 ”是 方法 必须 适用 于 问题 。 关 于 社会 背景 、 流 程 的 同 题 ， 以 及 人 们 相信 他 们 所 做 的 事 
和 他 们 真实 做 过 的 事 之 间 的 差异 ， 需 要 不 同形 式 的 调查 ， 这 不 是 算 法 性 能 能 解决 的 问题 。 


2.3 ”整合 证 据 


解决 证 据 局 限 性 的 一 种 方法 是 结合 不 同形 式 或 不 同 渠 道 的 证 据 ， 就 是 把 针对 同样 问题 的 不 
同 研究 结果 整合 起 来 。 梳 理 证 据 背 后 的 原因 是 ， 如 果 不 同形 式 的 证 据 或 者 不 同 渠 道 的 证 据 能 够 
呼应 的 话 〈 或 者 至 少 不 相 互 矛盾 ) ， 它 们 就 聚集 了 一 种 “重要 性 ”， 加 在 一 起 的 可 信和 度 更 高 。 

软件 工程 还 没有 证 据 的 合并 体 。 然 而 ， 已 经 有 很 多 人 在 努力 合并 证 据 。Barbara Kitchenham 
及 其 同事 们 一 直 在 支持 系统 性 文献 评审 的 运动 , 使 用 有 明确 标准 的 评估 框架 来 检验 并 集合 关于 特 
定 话题 的 已 发 表 的 证 据 。 比 如 ，Jergensen 和 Shepperd 在 成 本 模型 上 的 研究 汇集 并 整合 了 比较 模型 
和 人 脑 之 间 估 算 性 能 的 证 据 ， 并 指出 它们 大 体 上 是 可 以 比较 的 路。 有 趣 的 是 ， 系 统 性 评审 (以 及 
Kitchenham 等 人 实施 的 对 系统 性 评审 的 第 三 方 评审 ) 暴露 了 证 据 基础 中 的 引 人 注 意 的 弱点 ”。 

O 软件 工程 中 的 大 部 分 话题 几乎 没有 可 信和 的 证 据 ，。 

口 对 发 布 证 据 质 量 的 担忧 使 努力 得 不 到 回报 。 

O 对 汇报 证 据 质 量 的 担忧 (如 ， 是 否 充分 并 人 准确 地 描述 了 方法 ) 限制 了 证 据 的 评估 。 

然而 ， 系统 性 评审 不 是 验证 研究 结果 的 最 终 判 定 。 它 们 的 弱点 之 一 是 这 种 集合 研究 的 方式 使 
之 很 难 对 研究 背景 有 适当 的 关注 , 而 这 在 验证 和 应 用 研究 时 的 重要 性 是 被 普遍 公认 的 。 可 能 产生 
的 后 果 是 ， 系 统 性 评审 很 难处 理 定性 研究 ,也 因此 经 常 把 它们 排除 在 评审 之 外 ， 从 而 也 排除 了 它 
们 所 提供 的 证 据 。 另 一 个 后 果 是 ， 把 不 同 背景 的 研究 结果 放 在 一 起 时 〈 如 ， 学 生 的 实践 和 专业 人 
员 的 实践 )， 如 果 把 它们 的 背景 看 成 等 同 的 话 ， 就 会 有 过 度 普 遍 化 的 危险 。 

方法 论 , 包含 方法 的 标准 应 用 的 统一 调查 系统 ,提供 了 让 研究 员 比 较 和 对 比 结果 的 有 利 条 件 ， 
因此 , 证 据 能 够 随 着 时 间 而 积累 , 稳定 可 靠 的 证 据 能 为 知识 提供 有 力 的 基础 。 像 化 学 这 样 的 学 科 ， 
特别 是 有 详细 说 明 的 关注 点 和 标准 的 问题 形式 的 子 学 科 ， 有 定义 完备 的 方法 论 。 它 们 也 可 能 有 标 
准 的 汇报 实践 ， 通 过 标准 的 汇报 形式 来 强制 标准 的 方法 论 。 

任何 方法 论 都 是 一 种 镜头 ， 研 究 者 可 以 通过 不 同 的 镜头 观察 整个 世界 。 但 重要 的 是 ， 必 须 承 
认 不 是 所 有 的 事物 都 在 聚焦 范围 之 内 。 对 方法 论 的 盲目 追随 会 导致 各 种 难堪 的 失误 , 特别 是 当 研 
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究 者 不 理解 方法 论 背 后 的 惯例 和 假设 时 。 即 使 存在 普遍 接受 的 方法 论 ， 研 究 者 也 不 能 解除 责任 ， 
放弃 从 所 需 证 据 的 角度 来 证 明 技术 选择 的 正当 性 。 

基准 测量 是 软件 工程 方法 中 基于 集合 证 据 产 出 适当 结果 的 例子 。 它 需要 根据 定义 非常 准确 的 
程序 (或 基准 ) 来 度量 性 能 。SPEC CPU 基准 是 一 个 很 好 的 例子 ， 不 管 它 的 名 字 如 何 ， 它 度量 了 
CPU、 内 存 子 系统 、 操 作 系统 和 高 CPU 使 用 率 应 用 程序 编译 器 的 组 合 性 能 。 它 包含 了 一 系列 应 用 
程序 源码 ， 外 加 如 何 编译 它们 的 详细 指示 ， 以 及 如 何 运 行 输入 并 度量 它们 的 指示 。 

如 果 基 准 有 明确 的 规定 和 适当 的 应 用 ,你 就 能 很 准确 地 知道 基准 的 结果 意味 着 什么 ,也 就 不 
需要 懂 乱 地 比较 Sgn、HP、Intel 之 间 的 结果 差异 。 这 种 可 靠 性 和 可 比 性 正 是 发 明基 准 的 目的 ， 也 
使 它 成 为 了 可 信 度 的 标志 。 

那 基准 是 免费 的 午餐 吗 ? 当然 不 是 ! 对 基准 证 据 的 真正 顾虑 是 相关 性 : 所 使 用 的 度量 是 否 能 
代表 所 关 广 的 现象 并 适用 与 此 。 基 准 所 包含 的 内 容 始终 是 一 个 值得 关 广 的 问题 ， 而 且 负 汕 争 吵 不 
IK. SPEC CPU 从 这 方面 来 说 是 相当 成 功 的 , 但 论 及 其 他 ， 如 关系 型 数据 库 管 理 系 统 (RDBMSes) 
事物 处 理 负 载 量 的 基准 TPC-C， 就 引起 了 很 多 的 怀疑 。 
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即使 古 高 质量 的 证 据 也 通常 是 片面 的 。 我 们 常常 不 能 直接 评估 一 个 现象 ， 所 以 我 们 只 能 研究 
那些 我 们 能 直接 研究 的 结 有 末 ， 或 者 只 观 注 现象 的 一 部 分 ， 或 者 从 特定 的 角度 观 注 它 ， 又 或 者 我 们 
只 观 注 那 些 我 们 能 度量 的 东西 ， 并 希望 它 能 映射 到 我 们 真正 关心 的 东西 上 。 度 量 是 一 种 速记 ,是 
对 现象 的 简洁 表达 或 反映 。 但 它 通 常 不 是 现象 本 映 ; 度量 是 一 种 有 代表 性 的 人 简化。 高 可 信 度 需要 
证 明 所 做 选择 的 合理 性 。 

BORSA, 证 据 是 会 有 偏见 的 。 多 少 软 件 工 程 师 会 相信 那些 老 套 的 清洁 剂 广告 中 的 消费 者 
实验 和 “ 宦 济 ” 〈 “Duz 能 清河 更 多 碗 盘 …… ) ? 广告 法 规 要 求 这 种 消费 者 实验 必须 遵循 一 定 
的 标准 使 条 件 具 备 可 比 性 : 同样 的 污垢 、 同 样 的 用 水 量 、 等 量 的 请 洗 剂 等 。 但 是 广告 商 可 以 任意 
制定 条 件 。 他 们 可 以 优化 一 些 条 件 ， 如 污垢 的 种 类 和 适 于 产品 的 水 温 。“ 哈 ! ”我 们 会 说 ，“ 偏 
见 是 与 生 俱 来 的 。” 而 许多 发 表 的 软件 工程 方法 和 工具 评 鸽 仍然 遵循 了 同样 的 模式 : 无 论 是 有 总 
的 还 是 无 意 的 , 评估 的 背景 是 有 所 设计 的 ， 以 证 明 所 推销 的 方法 或 工具 的 优点 ， 而 不 征 基于 独 芯 
定义 的 有 根据 的 标准 ， 公 平地 与 其 他 工具 和 方法 做 比较 。 

当 证 据 悄 悄 地 被 焉 污 和 妥协 时 , 偏见 就 产生 了 。 这 走 因 为 之 前 疫 有 芳 虑 到 的 因素 导致 了 结 朱 
扭曲 ， 这 样 的 因素 包括 如 其 他 影响 、 合 并 变量 、 不 适当 的 度量 、 或 者 对 样本 的 选择 不 具 代 表 性 。 
偏见 会 对 研究 的 有 效 性 产生 威胁 ， 所 以 当 我 们 在 评估 可 信 度 的 时 候 会 寻找 可 能 存在 的 偏见 。 

我 们 不 只 需要 理解 特定 证 据 的 价值 和 局 限 性 , 也 要 了 解 不 同形 式 的 证 据 如 何 比 较 , 以 及 他 们 
如 何 能 相互 组 合 来 补偿 各 目的 局 限 性 。 


2.4 证 据 的 类 型 以 及 它们 的 优 缺 点 
让 我 们 来 用 一 个 例子 来 更 好 地 说 明 。 想 象 我 们 正在 评估 一 种 新 的 软件 工程 技术 “AWE” (A 
































Wonderful Excitement， 美 妙 的 新 方法 ) ， 它 被 用 来 奉 代 “BURP” (Boring but Usually Respected 
Predecessor， 杆 燥 但 被 口碑 民 好 的 旧 方 法 ) 。 我 们 需要 考虑 哪 种 证 据 来 决定 是 否 采用 AWE? 在 接 
PHA, 我 们 会 摘 述 稍 见 类 型 的 研究 ,并 根据 可 信和 度 和 适用 度 的 典型 问题 对 每 个 类 型 进行 
评估 。 





2.4.1 对照 实 验 和 准 实验 


对 照 实验 在 我 们 需要 对 两 种 或 多 种 条 件 进 行 直接 比较 时 适用 (如 使 用 AWE 相 对 于 使 用 
BURP) ， 它 基于 一 个 或 多 个 有 可 靠 度量 的 标准 ， 比 如 完成 特定 任务 所 需要 的 时 间 。 这 些 实验 在 
度量 很 环 手 时 也 很 有 帮助 ， 比 如 对 AWE 和 BURP 所 产 出 的 产品 中 的 缺陷 计数 。“ 对 照 ” 意 味 着 保 
持 所 有 (除了 把 AWE 换 成 BURP 以 外 ) 别 的 东西 为 常量， 这 点 我 们 可 以 直接 根据 工作 环境 和 所 要 
解决 的 任务 来 做 到 。 对 于 所 涉及 的 庞大 的 人 为 因素 变量 , 实施 对 照 的 唯一 方法 是 使 用 一 组 对 象 (而 
不 是 一 个 对 象 ) , 指望 所 有 的 差异 会 在 组 内 平均 化 ,。 如果 我 们 能 把 对 象 随机 分 组 的 话 (随机 实验 )， 
这 种 希望 是 被 证 明 合 理 的 (至 少 在 统计 意义 上 ) 。 当 然 只 有 所 有 对 和 象 使 用 AWE 和 BURP 的 能 力 相 
当时 ， 这 才 有 意义 。 随 机 实验 是 能 证 明 因 果 关 系 的 唯一 研究 方法 : 如 果 我 们 只 变动 了 AWE 和 
BURP， 那 结果 中 的 任何 改变 (除了 统计 波动 ) 都 是 由 这 个 差异 所 产生 的 。 

有 时 候 ， 我 们 不 能 随机 分 配 开 发 人 员 ， 因 为 我 们 只 能 对 已 经 存在 的 团体 进行 研究 。 比 如 ， 假 
设 我 们 正在 比较 C、C++、Java、Perl、Python、Rexx 和 和 TCL 语言 (如 第 14 章 所 述 ) 。 你 知道 多 少 
对 所 有 7 种 语言 都 同样 精通 的 程序 员 ? 对 一 项 随机 化 实验 来 说 ， 你 需要 很 多 这 样 的 人 来 填 满 7 组 1 
培训 足够 的 人 到 达 那 个 水 平 是 不 实际 的 。 在 这 种 情况 下 ， 我 们 使 用 现 有 的 团体 ( 准 实 验 ) , 但 需 
要 必须 考虑 的 是 ， 比 如 是 否 所 有 的 聪明 才子 都 只 用 B 或 P 开 头 的 语言 。 这 种 情况 意味 着 我 们 的 团 
体 反映 了 不 同 能 力 的 人 群 ， 因 此 会 焉 曲 比 较 的 结果 。 (虽然 ,我们 也 可 以 把 它 归 因 为 语言 本 身 的 
KHR. ) 

1. 可 信和 度 

给 定 了 一 个 清晰 民 好 的 假设 、 干 净 的 设计 和 实现 、 以 及 合理 的 度量 ,对 照 实验 的 可 信和 度 通 常 
很 高 。 因 为 理论 上 来 说 , 环境 设置 是 公平 的 ， 对 结果 的 解释 也 很 清晰 。 实 验 中 典型 的 可 信 度 问题 
包含 以 下 几 点 。 

e 0000 

研究 对 象 是 否 对 AWE 和 BURP 的 能 力 相 当 ? 如 果 不 是 , 实验 可 能 更 多 地 反映 了 参与 者 的 
特征 而 不 是 技术 的 特征 。 把 这 个 问题 稍微 变化 一 下 ， 就 会 微妙 地 涉及 动机 问题 : BURP RAE 

燥 而 AWE 很 让 人 兴奋 ， 但 长 期 来 看 就 未 必 如 些 。 如 果实 验 者 恰巧 是 AWE 的 发 明 者 而 因此 对 

AWE 韭 常 热 囊 的话， 差异 就 会 清晰 地 显现 出 来 。 

e 0000 

被 这 样 的 实验 者 选 出 的 任务 往往 会 突出 AWE 的 优势 而 不 是 BURP 的 优势 。 

e D00000000 

小 组 的 既 有 差异 造成 对 结果 的 和 焉 曲 经 常 是 准 实验 中 的 一 项 风险 。 
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2. 适用 度 
这 是 实验 真正 的 弱点 。 好 的 实验 设计 是 精确 的 , 限定 的 实验 环境 会 使 结 来 难以 运用 至 外 面 的 
世界 。 实 验 容易 出 现 “沙子 漏 过 手指 ”的 现象 : 一 个 人 可 能 抓 住 了 一 个 概念 ， 如 生产 力 ， 但 当 
概念 通过 许多 优化 后 ， 能 在 有 是 够 控制 的 环境 中 成 功 映 射 于 特定 的 度量 时 ， 它 似乎 已 近 汐 走 了 。 


K 











24.2 sides 


问卷 调查 : MEFA WARFARE. Ee Ee AS RA TK. RAN 
AWE 好 在 哪里 ? 我 个 人 发 现 BURP 乏 味 在 哪里 ?为 什么 ”社会 学 和 心理 学 已 经 制作 出 了 一 个 详 
细 的 (而 且 昂 贯 的 ) 方法 论 ， 来 找 出 能 正确 度量 针对 特定 问题 态度 的 合适 问题 。 不 垂 的 是 ， 这 种 
方法 论 在 软件 工程 调查 中 通常 被 忽视 了 。 

调查 也 可 以 用 来 收集 经 验 (可 靠 性 稍 低 )。 比 如 ，AWE 或 者 BURP 中 最 易 出 错 的 五 件 事 。 调 
查 可 以 很 好 的 规模 化 ， 是 涉及 大 量 对 象 的 最 便宜 方法 。 如 末 它 们 包含 开放 性 问题 的 话 ， 可 以 作为 
定性 其 至 定量 研究 的 基础 。 








1. 可 信和 度 
虽然 调查 既 便 宜 又 方便 ， 但 很 难 通 过 它们 达到 高 可 信和 度 。— 典 型 的 可 信和 度 问 题 包 括 : 
e O00000 
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结 未 。 这 些 问 题 可 能 很 细微 。 
*HUUUUUUU 

这 个 同 题 特别 会 出 现在 误 用 调查 来 获取 复杂 的 实际 问题 时 ，“ 你 的 AWE 图 通 第 包含 
少 缺 陷 ? “人们 不 能 给 出 准确 的 答案 ， 因 为 他 们 的 了 解 不 足以 回答 这 个 问题 。 如 采 我 们 就 事 
论 事 的 话 ， 这 个 问题 不 会 太 大 : 答案 揭示 了 回答 者 的 想法 ， 正 如 我 们 之 前 强调 的 那样 ， 它 反 
映 了 他 们 的 态度 。 然 而 更 常见 的 是 ， 答 案 被 看 成 真正 的 事实 ， 那 相应 的 结论 就 会 出 错 。 (在 
这 种 情况 下 ,评论 家 会 经 第 把 调查 评论 为 “ 太 主 观 ”, 但 古 调 查 就 应 该 是 主观 的 ! 如 条 主观 
古 一 个 同 题 的 话 ， 这 个 方法 就 是 被 误 用 了 。) 

















e D0DU0 
有 了 时, 回答 者 不 会 回答 他 们 真实 的 想法 , 而 是 因为 社会 政治 的 原因 压抑 或 他 大 了 霖 些 问题 。 
*HUUUUUUU 


调查 的 结 末 可 以 推广 至 任何 被 调查 者 的 样本 所 能 代表 的 目标 群体 。 这 个 群体 总 是 存在 
的 ， 但 是 研究 者 很 少 能 成 功 地 朱 述 它 。 


概括 说 来 ， 可 信和 度 要 求 两 个 条 件 。 第 一 ， 调 碍 必须 发 给 一 个 定义 清晰 的 、 多 于 理解 的 群体 。 
“从 日 期 D 到 日 期 E 中 ， 所 有 网 上 论坛 X、Y、Z 的 读者 ”是 清晰 的 定义 ， 但 不 易 理 解 ， 我 们 不 清楚 
这 群 人 到 底 是 谁 。 第 二 ， 群 体 中 必须 有 大 部 分 人 人 (50% 以 上 为 佳 ) 回答 了 问题 ,， 不然， 回答 者 就 
可 能 是 有 偏差 的 样本 。 也许 群体 中 4% 的 AWE 粉 丝 〈( 唯一 让 我 在 工作 中 保持 请 醒 的 东西 ”) 和 5% 
的 BURP 厌 恶 者 〈 太 讨厌 了 以 至 于 我 犯 了 两 倍 的 错误 ”) 最 有 动机 参与 , 但 是 能 让 他 们 代表 一 半 











20 第 2 章 ”可 信和 度 ， 为 什么 我 坚决 要 求 确信 的 证 据 


的 样本 量 吗 ? 

2. 适用 度 

调查 能 解决 的 问题 通常 不 是 我 们 最 关心 的 问题 。 回 答 形式 的 限制 通常 不 能 令 人 满意 , 也 很 难 
被 满意 地 解读 ， 所 以 通常 也 很 难 有 更 普遍 的 运用 。 然 而 ,调查 可 以 很 有 效 ， 它 可 以 提供 补充 信息 
并 为 其 他 形式 的 证 据 提供 背景 信息 : 如 提供 实验 参与 者 的 背景 信息 , 或 者 提供 满意 度 和 偏好 信息 
来 补充 性 能 数据 。 


2.4.3 ”经验 汇 报 和 案例 研究 
既然 实验 和 调查 有 局 限 性 , 而 且 我 们 对 基于 现实 世界 经 验 的 评估 感 兴趣 , 也 许 仔 细 深 入 地 观 








罕 一 到 两 个 实施 案例 会 提供 我 们 做 决定 所 需要 的 信息 , 或 者 至 少 把 我 们 的 注意 力 聚 焦 在 我 们 先 需 
要 回答 的 问题 上 。 


案例 研究 〈 或 者 它 不 那么 正式 的 亲戚 经 验 汇报 ) 描述 了 一 个 现象 (通常 是 一 系列 事件 及 其 结 
果 ) 在 真实 软件 工程 环境 下 的 特定 实例 。 原则 上 来 说 ,案例 研究 是 运用 详细 而 精确 的 方法 论 的 结 
R, 但 是 这 个 术语 通常 被 更 宽松 地 使 用 。 虽 然 现象 本 里 是 独特 的 ， 描述 它 时 ， 我 们 会 希望 其 他 情 
况 和 它 足 够 的 接近 ， 那 它 才 会 有 意义 。 

案例 研究 利用 许多 不 同类 型 的 数据 ， 如 研究 者 通过 不 同方 法 〈 如 直接 观察 、 面 谈 、 文 档 分 析 
以 及 特殊 目的 的 数据 分 析 程 序 ) 收集 的 谈话 、 活 动 、 文 档 和 数据 记录 。 案 例 研 究 可 以 针对 大 范围 
的 问题 ， 如 AWE 流 程 中 最 大 的 问题 是 什么 ? AWE 如 何 影 响 设计 活动 ? 它 如 何 影响 设计 结果 ? E 
如 何 组 织 测 试 流 程 ” 等 等 。 

在 我 们 的 AWE 对 比 BURP 的 例子 中 ，BURP 可 以 单独 作为 一 个 案例 来 研究 ， 也 可 以 作为 同一 
个 研究 的 第 二 个 案例 , 研究 者 尽 其 所 能 地 匹配 调查 和 讨论 的 结构 。 如 果 描 述 地 足够 具体 的 话 ， 我 
们 就 有 可 能 把 这 些 观察 结果 运用 到 我 们 的 环境 中 。 

1. JAE 

对 于 经 验 汇 报 和 案例 研究 来 说 , 充满 了 可 信和 度 的 问题 ,因为 这 些 研究 是 特定 于 它们 的 背景 的 。 
大 部 分 的 情况 都 与 以 下 有 关 : 

口 选择 性 的 记录 ; 

O 含糊 不 清 的 表达 。 

因此 , 准确 描述 设置 和 数据 并 小 心 解读 研究 结论 是 最 重要 的 事情 。 案例 研究 的 可 信 度 关键 在 
于 汇报 的 质量 。 

2. 适用 性 

通常 ， 研究 者 和 出 版 者 发 表 经 验 汇 报 和 案例 研究 ， 是 因为 相信 它们 的 普遍 适用 性 。 解 读 适 用 
性 很 具有 挑战 ， 因 为 不 同 的 设置 之 间 会 有 许多 重要 的 不 同 点 。 但 这 种 汇报 中 所 提出 的 问题 的 适用 
性 是 公认 的 ， 即 使 结论 的 相关 性 难以 确定 。 


2.4.4 其 他 方法 
之 前 的 草 下 并 不 是 无 一 不 包 的 。 比 如 , 我们 也 许 会 使 用 基准 方法 评估 文 持 AWE 和 BURP 延 展 
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性 的 工具 ， 或 者 用 用 户 研 究 来 评估 易学 性 和 易 出 错 性 。 这 些 方法 《和 其 他 方法 ) 都 有 自己 的 可 信 
度 和 适用 性 的 问题 。 


2.4.5 报告 中 的 可 信 度 《或 缺乏 可 信 度 ) 的 标识 


如 末了 解 了 之 前 章 广 所 讨论 的 基本 原则 问题 之 后 , 你 会 发 现 可 信和 度 很 大 程度 上 可 以 归结 为 做 
得 好 或 做 得 不 好 的 很 多 方面 。 现 在 我 们 将 讨论 在 如 何 从 这 些 方面 来 分 析 研 究 报告 的 可 信和 度 。 

1. 一 般 特性 

对 于 一 个 高 可 信 度 的 研究 来 说 : 

O 它 的 谍报 是 详细 而 准确 的 (而 不 是 含糊 不 清 的 ) ，; 

O 讨论 的 形式 是 诚实 的 (而 不 是 搞 搞 门 面 功夫 )， 逻 辑 和 论点 都 是 正确 的 (而 不 是 不 一 致 的 

或 是 假 的 、 不 合 逻 辑 的 ); 

O 研究 的 设置 能 最 大 化 适用 性 (而 不 是 过 于 简单 或 过 于 专门 化 )，; 

口 虽然 本 身 很 枯燥 ,但 是 好 的 报告 的 行文 应 该 尽量 生动 (而 不 是 很 无 趣 )。 

2. 清晰 的 研究 问题 

表述 清晰 明确 的 研究 问题 是 可 信和 度 的 基础 ， 因 为 如 条 作者 不 解释 他 们 在 寻找 什么 , 那 他 们 还 
能 拿 出 什么 东西 让 你 相信 呢 ? 研究 问题 不 需要 大 张 旗 鼓 地 宣告 , 但 必须 可 以 从 概要 和 简介 中 清楚 
地 辨别 出 来 。 

通常 ， 研 究 问题 是 可 以 被 清晰 地 辨别 出 来 的 ， 但 是 问题 本 身 却 很 含糊 。 在 这 种 情况 下 ， 结 有 末 
要 不 束 是 也 很 含糊 , 或 者 会 沉 有 意外 性 和 随机 性 。 这 类 研究 也 许 读 起 来 很 有 趣 , 但 可 信 度 达到 中 
SHAE I 

3. 对 研究 安排 的 信息 说 明 

理解 研究 的 设置 是 可 信和 度 的 核心 , 这 也 是 新 闻 稿 和 科技 报告 的 主要 区 别 。 即使 是 最 吸引 人 的 
结果 ， 如 果 它 是 通过 有 盯 着 水 品 球 看 出 来 的 ， 那 也 不 会 有 可 信和 度 。 以 下 的 研究 结果 一 定 很 吸 3| 人 人 : 
“600 人 参与 的 实证 研究 显示 Java 在 各 个 方面 都 比 C++ 好 : 编程 时 间 缩 得了 11%， 调 试 时 间 缩 得了 
47%， 长 期 设计 稳定 度 提高 了 42%。 只 有 在 运行 性 能 上 ，CT++ 仍 高 出 Java 23%, ” 

但 如 果 你 知道 这 些 结 果 是 通过 问卷 调查 而 得 出 的 话 ， 那 可 信 度 就 大 打折 扣 了 。 如 果 你 仔细 查 
看 问题 的 话 ， 可 信 度 会 继续 降低 : 他 们 是 如 何在 程序 完全 不 同 的 情况 下 比较 编程 和 调试 时 间 的 ? 
哦 ， 他 们 问 了 任务 完成 的 时 间 比 预期 时 间 长 的 频率 ! 那 “ 长 期 设计 稳定 度 ” 是 什么 ” 哦 ， 他 们 问 
了 方法 中 有 多 少 部 分 是 从 来 不 变 的 ! 问题 都 出 在 细 市 上 : 方法 、 样 本 、 数 据 、 分 析 。 

粗略 的 赁 经 验 来 说 , 你 可 以 完全 忽略 那些 没有 描述 设置 的 研究 ， 对 那些 设置 的 描述 使 你 产生 
好 奇 疑问 的 研究 ,你 也 要 保持 怀疑 的 态度 : 这 是 哪个 类 型 的 研究 ? 研究 对 象 着 手 于 哪些 任务 ? 在 
哪 种 工作 环境 下 ? 研究 对 象 是 谁 ? 数据 是 如 何 收集 的 ? 数据 是 如 何 验证 的 ? 主要 的 度量 定义 到 
何 种 精度 ? 一 份 优秀 的 实证 赋 究 报告 能 令 人 请 意 地 回答 所 有 这 些 问题 。 

4. 有 意义 并 能 让 人 理解 的 数据 呈现 

当 你 知道 研究 是 如 何 构造 的 、 数 据 是 如 何 收 集 的 时 候 ， 你 需要 进一步 了 解 关 于 数据 本 身 的 信 
息 。 研 究 报告 可 能 设 有 空间 来 发 布 原始 数据 ， 所 以 ， 即 使 是 很 小 的 研究 也 会 通过 统计 学 家 所 说 的 
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描述 统计 学 来 总 结 数据 。 

假设 有 一 项 涉及 6 个 不 同 小 组 和 5 个 不 同 度量 的 研究 。 一 些 作 者 会 用 表格 来 至 现 他 们 的 数据 ， 
每 行列 出 小 组 名 字 、 小 组 大 小 , 还 可 以 列 出 针对 一 个 度量 的 最 大 值 、 了 最 小 值 、 平 均值 、 标 准 差 等 。 
表格 被 分 成 5 块 ， 每 块 包含 6 行 这 样 的 数据 ， 总 共有 37 行 ， 占 据 半 页 以 上 的 空间 。 当 你 看 到 这 样 的 
信息 时 会 怎么 做 ?你 可 以 忽略 这 个 表格 (因此 就 不 能 细 查 数据 ) ,或 者 你 可 以 试图 针对 每 个 度量 
仔细 比较 不 同 组 的 数据 。 在 后 者 的 情况 中 ,你 会 在 脑子 里 创造 一 副 全 景 图 ， 首 先 得 想 明 白 个 体 条 
目 ， 然 后 形象 化 它们 之 间 的 关系 。 用 更 有 趣 的 话说 ， 你 会 掘 出 数据 的 坟墓 ， 让 它们 复活 ， 然 后 按 
是 你 的 音乐 跳舞 。 

我 们 更 希 记 作者 们 保持 他 们 数据 的 原样 ， 把 它们 通过 末 种 方法 表达 出 来 ， 帮 助 读 者 的 介入 : 
通过 找到 与 作者 想 要 讨论 的 关键 问 题 和 关系 相关 的 直观 表示 ， 以 及 与 表格 和 文本 数据 显示 直接 、 
清晰 相关 的 可 视 化 呈现 。 良 好 的 数据 呈现 包含 突出 视觉 效果 (如, 标尺、 色彩 ) ， 能 前 后 一 致 地 
表达 出 所 关注 的 数据 。 差 得 数据 呈现 所 使 用 的 可 视 化 品质 会 使 观众 对 数据 的 理解 产生 转移 或 模 
糊 ， 比 如 ,通过 用 线段 连接 离散 数据 来 表达 菏 种 连贯 性 ， 或 者 通过 在 相关 图 未 上 使 用 不 同 的 比例 
尺 或 者 使 用 起 始点 不 为 0 的 标尺 , 或 者 通过 添加 比 原始 数据 更 突出 的 外 来 的 元 素 。Edward R. Tufte 
有 一 本 关于 如 何 正确 进行 数据 可 视 化 工作 的 开创 性 著作 ”|，。 

5. 透明 的 统计 分 析 (如果 有 的 话 ) 

统计 分 析 (演绎 统计 学 ) 说 的 是 从 “信号 ”中 分 离 “ 噪 声 ”: 把 可 能 是 从 巧合 或 错误 中 得 出 
的 结 来 分 离 于 从 有 意义 的 研究 现象 中 得 出 的 结 末 。 运 用 统计 的 目的 古 降 低 解 读 结 末 的 不 确定 性 。 
但 是 ， 许 多 作者 把 统计 分 析 作 为 一 种 威胁 。 他 们 列 出 所 有 的 Alpha 级 别 、p 值 、 目 由 度 、 剩 余 平方 
和 、M 参 数 、Z、0、1 系 数 、D、z 等 所 有 一 切 。 这 只 是 为 了 告诉 你 : “如 末 你 敢 质 疑 我 的 观 后 ， 
我 就 会 用 我 的 显著 性 测试 来 仍 你 的 脑袋 。” 可 信 的 研究 使 用 统计 数据 来 解释 和 确保 结果 ， 差 的 研 
究 使 用 它们 来 混 消 视 听 〈 因 为 作者 需要 隐藏 弱点 ) 或 个 下 他 人 【因为 作者 自己 不 能 确定 这 些 统计 
戏法 的 意义 ) 。 

在 好 的 研究 中 , 作者 会 用 人 简单 的 语言 解释 他 们 所 使 用 的 每 个 统计 推论 。 他 们 更 喜欢 使 用 易于 
理解 的 推论 (如 置信 区 间 ) 而 不 是 难以 解释 的 推论 (如 p 值 和 效能 ， 用 标准 差 归 一 的 效应 量 )。 他 
们 会 清晰 地 用 如 下 语句 解读 每 个 结 末 : “这 里 也 许 有 一 些 真正 的 差异 ”( 正 面 结 琳 )，“ 这 里 似乎 
没有 影响 ， 或 者 只 有 很 少 的 影响 ;我 们 看 到 的 大 部 分 征 随机 噪声 ”负面 结 末 ) ， 或 者 “还 不 清楚 
其 意义 ”( 空 结 来 )。 即 使 是 最 后 的 那 种 结果 ， 也 很 令 人 安心 ,因为 它 告诉 你 在 看 到 数据 时 对 其 意 
义 的 不 确定 是 有 原因 的 ， 即 使 征 统计 推论 也 不 能 排除 这 个 不 确定 性 〈 至 少 不 能 通过 这 个 来 排除 ; 
也 许 有 不 同 的 分 析 可 以 市 来 指 路 明灯 ) 。 

6. 诚实 地 讨论 局 限 性 

任何 实证 研究 的 坚实 汇报 都 需要 有 一 个 独立 章 贡 来 讨论 研究 的 局 限 性 , 通 芝 以 “对 有 效 性 的 
威胁 为 标题 。 这 个 讨论 提供 关于 以 下 同 题 的 信息 : “什么 是 通过 这 个 研究 所 不 能 达到 的 ， 什 
么 样 的 解读 会 有 问题 (构建 效 度 )”，“ 研 究 中 的 什么 东西 可 能 或 者 已 经 出 错 了 (内 部 效 度 )”， 
“要 推广 研究 结 来 的 限制 是 什么 (外 部 效 度 )”。 对 一 份 好 的 研究 报告 来 说 ,你 通常 已 经 意识 到 了 
这 些 问 题 ， 那 这 个 草 区 就 不 会 提供 许多 令 人 慨 讶 的 信息 。 可 信人 研究 的 作者 能 接受 批判 点 的 存在 。 
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如 末 一 份 研 究 试 图 消除 所 有 批评 的 可 能 性 ， 通 常 不 是 一 个 好 的 兆头 。 

如 琳 做 得 好 的 话 , 最 有 趣 的 部 分 通 第 是 对 可 推广 性 的 讨论 , 因为 这 直接 和 结 末 的 适用 性 相关 。 
好 的 报告 会 同时 在 不 同方 面 针 对 不 同 的 推广 目标 领域 提供 正面 和 反面 的 可 推广 性 观 后 。 

7. 坚实 且 适 用 的 结论 

实证 研究 报告 的 挑剔 读者 们 会 基于 他 们 目 己 对 所 至 证 据 的 评 佑 形成 目 己 的 观点 , 不 会 单纯 依 
赖 于 作者 在 摘要 和 绪论 中 提供 的 陈述 。 

如 朱 作 者 的 结论 过 分 吹 只 了 结 末 《把 结 东 推 广 至 没有 坚固 论点 支撑 的 领域 ， 或 有 其 者 ， 基 于 
只 与 妍 究 现 象 有 粗略 联系 的 现象 得 出 结论 )， 你 就 更 应 该 对 报告 其 余部 分 的 可 信 度 提高 警惕 。 你 
尤其 应 该 拿 起 一 文 最 粗 的 红 笔 , 划 掉 摘要 和 结论 ， 那 你 就 绝 不 会 在 重新 整理 你 对 特定 研究 的 记忆 
时 依赖 它们 了。 请 记 住 很 少 有 读者 这 样 做 ,而 所 有 人 都 需要 重新 整理 他 们 的 记忆 。 因 此 , 很 多 在 
报告 或 课本 中 引用 的 研究 会 错误 地 指 癌 伶 张 的 结论 ， 就 像 它们 是 真 的 一 样 。《〈 人 无 完 人 ， 科 学 家 
也 不 例外 。 ) 

如 采 是 男 一 种 情况 , 结论 看 起 来 很 有 思想 , 明显 试图 在 可 信 度 和 适用 性 之 前 寻找 一 个 平衡 的 
话 ， 它 们 的 可 信 度 会 加 固 , 适用 度 会 被 最 大 化 。 这 样 的 作者 把 研究 的 结 末 和 限制 同时 放 在 一 个 秤 
RE, MERA (从 文献 中 其 他 结 末 的 角度 来 看 ) 的 普 志 化 问题 放 在 另 一 个 秤 盘 ， 然 后 告诉 你 他 
们 所 想 的 可 能 是 正确 的 归纳 。 这 样 的 信息 古 有 价值 的 , 因为 作者 有 很 多 在 文 草 中 没有 明显 出 现 的 
研究 信息 ， 但 却 在 判断 的 时 候 使 用 到 了 。 
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目前 为 止 ， 你 大 概 会 同意 达到 高 可 信 度 绝 非 多 事 。 然 而 ， 这 并 不 意味 着 没有 (或 几乎 没有 ) 
可 靠 的 研究 ， 只 古 可 靠 的 研究 总 古 很 少 。 它 们 比 我 们 想象 中 的 专业 得 多 ,而 且 充 满 了 我 们 不 喜欢 
的 “如 采 、 “ 当 ”和 众多 假设 。 在 这 样 的 情况 下 抱怨 是 没有 意义 的 ; 这 只 是 我 们 所 生存 和 创造 
(就 技术 而 言 ) 的 复杂 世界 所 造成 的 不 可 规避 的 结 末 。 如 采 我 们 足够 耐心 ， 并 且 能 对 我 们 已 经 发 
现 的 东西 感到 高 兴 的 话 ， 那 这 就 不 古 一 个 问题 。 

我 们 认为 ， 真正 的 问题 在 于 : 虽然 工程 师 和 科学 家 们 很 理解 复杂 性 ， 也 很 重视 复杂 性 及 其 市 
来 的 工作 量 , 而 且 还 能 对 它 表 示 铭 长 , 但 是 我 们 整体 的 社会 和 文化 并 不 古 这 样 。 我 们 被 许多 壮观 
的 事物 和 景 辊 所 包围 ， 所 以 不 再 把 小 新 闻 当 做 新 闻 。 我 们 很 难 去 留意 那些 由 50 个 单词 组 成 的 未 经 
扭曲 的 、 错 综 复 杂 的 研究 结论 。 

大 众 妹 体 会 因此 有 所 行动 。 为 了 吸引 眼球 ， 他 们 忽视 、 屯 张 或 扭曲 实证 研究 的 结论 ， 这 些 结 
论 通 弟 被 弄 得 面目 全 非 。 科 学 家 们 通常 也 帮 不 了 什么 忙 ， 只 能 写 写 所 请 的 摘要 ,仅仅 是 宣布 结 琳 
而 不 古 总 结 概括 它们 。 在 任何 情况 下 ， 担 子 邦 会 压 在 挑剔 肘 读 者 局 上 ， 和 需要 他 们 更 仔细 地 阅读 。 
你 需要 从 人 研究 中 挖 气 出 一 份 报告 ， 消 化 它 ， 决 定 它 的 可 信和 度 ， 把 对 你 可 靠 和 相关 的 东西 市 回 家 。 
作为 软件 工程 师 你 的 资质 意味 着 你 有 能 力 这 样 做 。 软 件 工程 的 进步 需要 许多 工程 师 经 闻 实 践 这 种 
能 力 。 这 本 书 的 内 容 就 代表 着 一 次 实践 的 大 好 机 会 。 

观测 研究 已 经 证 明 的 一 件 事 是 : 软件 工程 专家 会 收集 与 之 相关 的 证 据 , 根据 它们 的 目的 确定 
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所 和 需 的 可 信 程度 。 也 就 是 说 ， 如 来 它们 在 为 专业 首 啊 设计 数字 过 站 如 ， 它 们 可 能 会 做 一 个 基于 输 
出 的 对 照 实验 , 来 确定 软件 是 个 产 出 了 人 耳 所 需 的 音质 。 如 本 他 们 正在 和 市 场 部 和 争论 使 用 模拟 控 
制 的 客户 是 否 有 处 理 虚 拟 化 接口 的 准备 ,他 们 可 能 会 把 一 位 研究 员 派 去 现场 讨论 “什么 是 客户 所 
控制 的 参数 ”，“ 他 们 的 现 有 系统 如 何 运 作 ”，“ 客 户 认 为 他 们 的 任务 如 何 ” 等 。 如 末 他 们 正在 
设计 安全 性 至 关 重 要 的 前 端 系统 , 他 们 可 能 会 做 一 次 客户 研究 来 确定 儿 个 设计 选择 中 的 哪 一 个 能 
最 好 地 适应 人 机 交互 。 如 和 东 他 们 在 设计 安全 性 至 关 重 要 的 后 端 系统 ,他 们 可 能 使 用 正二 的 方法 来 
建 并 对 特定 需求 的 正确 实现 。 如 琳 他 们 在 优化 排 程 演算 法 ， 他 们 也 许 会 对 工业 投入 运行 基准 。 
所 以 我 们 不 该 拒绝 各 种 形式 的 证 据 ， 我 们 应 该 拥抱 它们 ， 努 力 思 芳 并 保持 批判 性 。 
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我 们 能 从 系统 性 评审 中 
学 到 什么 


Barbara Kitchenham 


我 在 强烈 提倡 循 证 软件 工程 09 B9 的 同时 ， 也 强烈 提倡 系统 性 评审 (SR) POPS See EL 
程 中 有 时 被 称 为 系统 性 文献 评审 ,以 避免 与 检查 方法 混淆 (如 ,阅读 和 审查 软件 工程 文档 和 代码 
的 方法 ) 。 如 果 没 有 健全 的 方法 论 来 集合 不 同 实证 研究 的 证 据 ， 那 循 证 软件 工程 就 不 可 能 存在 。 
系统 性 评审 恰恰 提供 了 这 种 方法 论 。 

系统 性 评审 已 经 在 其 他 学 科 中 被 广泛 应 用 了 几 十 年 。 当 研究 人 员 需 要 调查 针对 一 个 特定 “ 话 
题 ”的 所 有 支持 性 或 反驳 性 证 据 时 ， 就 需要 启动 一 次 系统 性 评审 。 在 软件 工程 中 ,通常 会 涉及 打 
听 一 种 方法 或 者 流程 的 效果 。 实 施 系 统 性 评审 的 研究 人 员 会 选择 与 特定 研究 问题 相关 的 实证 研 
究 ， 评 估 每 个 研究 的 有 效 性 ， 然 后 确定 这 些 研 究 所 显示 的 趋势 。 因 此 ， 系 统 性 评审 旨 在 以 一 种 公 
平 、 可 复 验 、 可 审查 的 方式 ， 找 到 、 评 估 并 集合 所 有 关于 某 个 话题 的 相关 证 据 。 

这 一 章 会 带 着 对 实证 软件 工程 的 普遍 关注 来 向 读者 介绍 系统 性 评审 的 价值 。 我 也 力求 帮助 见 
习 研 究 人 员 (如 博士 生 ) 开始 使 用 系统 性 评审 ， 他 们 可 能 正在 寻找 可 靠 的 方法 来 着 手 能 代表 领域 
发 展 水 平 的 评审 。 这 一 章 应 该 也 会 对 更 有 经 验 的 实证 研究 者 有 所 帮助 , 他们 也 许 对 系统 性 评审 的 
方法 论 的 价值 还 没有 足够 的 信心 。 许 多 欧洲 研究 者 已 经 开始 发 表 软 件 工程 的 系统 性 评审 , 但 来 自 
美国 的 研究 者 相对 较 少 中 中 1。 

我 也 希望 这 一 章 内 容 能 提醒 实证 研究 者 ， 他 们 的 研究 可 能 也 会 为 将 来 系统 性 评审 做 出 贡 
献 ， 并 因此 能 在 汇报 他 们 结果 的 同时 谨 记 将 来 研究 证 据 的 集合 。 最 近 的 一 次 系统 性 评审 发 现 ， 
很 难 开始 一 个 完整 的 元 分 析 ， 因 为 个 体 的 原始 研究 在 汇报 他 们 的 结果 时 使 用 了 完全 不 同 的 实践 
方法 Po 

在 循 证 软件 工程 的 背景 下 ， 系 统 性 评审 的 目标 不 只 是 为 研究 者 提供 方法 论 ， 而 是 影响 实践 。 
因此 , 我 希望 业界 的 管理 者 和 决策 者 也 能 在 这 章 中 找到 一 些 与 他 们 需求 相关 的 东西 。 业 界 最 大 的 
教训 是 ，“ 常 识 ” 和 专家 观点 不 应 该 是 决定 选择 软件 工程 方法 的 唯一 基础 。 此 外 ， 很 不 幸 的 是 ， 
不 能 默认 地 信赖 个 体 的 实证 研究 。 面 对 关于 采用 新 方法 的 重要 决定 时 , 决策 者 需要 不 带 偏见 地 对 
所 有 的 相关 证 据 的 概括 。 系 统 性 评审 恰恰 提供 了 交付 这 种 概括 的 方法 。 
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3.1 系统 性 评审 总 贤 


可 信 的 调查 始 于 原始 研究 : 带 有 与 所 研究 问题 相关 的 定性 和 定量 结果 的 实验 。 一 次 系统 性 评 
审 集合 了 不 同 独 立 实验 的 结果 ， 有 时 会 运用 统计 学 的 元 分 析 。 

证 明 系 统 性 评审 必要 性 的 典型 例子 来 自 医 学 领域 。 在 1990 年 ，Crowley 等 人 发 布 了 一 份 关 于 对 
将 要 早产 的 孕妇 使 用 皮质 激素 效果 的 系统 性 评审 ， 其 中 包括 一 份 对 于 12 项 原始 研究 的 元 分 析 11。 
皮质 激 过 被 认为 能 减少 早产 儿 的 肺 部 问题 。Crowley 等 人 的 系统 性 评审 确认 了 皮质 激素 的 使 用 大 
幅度 地 减 小 了 新 生 儿 的 死亡 风险 。 在 那个 时 候 ， 皮质 类 激素 并 不 是 治疗 早产 儿 的 标准 方法 ， 系 统 
性 评审 的 发 布 改 变 了 医疗 实践 。 

然而 ， 这 并 没有 被 认为 是 循 证 医学 的 重大 胜利 。 在 那 12 篇 研究 中 ，8 篇 是 在 1982 年 之 前 发 表 
的 。 如果 那 8 篇 研究 能 在 1982 年 集合 的 话 , 8 年 的 错误 治疗 和 与 之 相关 的 新 生 儿 死亡 就 能 够 被 避免 。 
这 引发 了 对 及 时 集合 证 据 的 重要 性 的 重新 评估 ， 以 及 Cochrane 协 作 组 织 的 建立 ， 该 非 营 利 组 织 旨 
在 实施 针对 医疗 和 保健 问题 的 系统 性 评审 ， 并 维护 系统 性 评审 报告 数据 库 。 

你 可 以 在 Cochrane 协 作 组 织 的 知识 库 中 找到 免费 的 Crowley 等 人 对 皮质 类 激素 报告 的 更 新 ”。 
这 不 只 是 为 了 记录 历史 ; 对 那些 新 开始 系统 性 评审 的 研究 员 来 说 , 这 也 是 一 个 很 好 的 优质 评审 的 
例子 。 

你 也 许 会 问 系 统 性 评审 有 什么 创新 。 和 毕竟 , 软件 工程 研究 者 已 经 持续 多 年 产 出 不 落后 于 时 代 
的 报告 ,并且 在 汇报 他 们 最 新 研究 成 末 的 同时 ， 也 总 结 了 相关 的 工作 。 要 回答 这 个 问题 ， 我 们 得 
先 看 看 其 他 使 用 系统 性 评审 的 学 科 (例如 ， 心 理学 、 社 会 学 和 医学 ) ， 它 们 已 经 找 出 了 由 于 缺乏 
正规 方法 论 而 导致 的 传统 评审 中 的 无 数 问 题 。 

e 0000000 

Antman 等 人 确认 了 专家 观点 不 总 能 反映 当前 的 医学 知识 状态 。 
e 000000“ 0000" DO00000 

Shadish 调 研 了 超过 280 篇 心理 学 期 刊 文章 的 作者 。 他 发 现 文章 经 常 引 用 革 些 研究 的 原因 
并 不 是 因为 它们 的 高 质量 ， 而 是 因为 它们 支持 了 作者 的 观点 1。 
e 00000000000000 

比如 ,一 份 非 正 规 的 评审 说 服 了 诺 贝 尔 奖 得 主 Linus Pauling， 大 剂量 的 维生素 C 可 以 抵 

抗 常规 感冒 。 然 而 ， 一 份 系统 性 评审 得 出 了 与 之 相反 的 结论 ， 并 发 现 Pauling 并 没有 3| 用 15 

篇 有 可 靠 方 法 论 基础 的 研究 中 的 至 少 5 篇 1。 

系统 性 评审 的 主要 优势 是 , 他 基于 定义 完备 的 方法 论 。 开展 一 项 系统 评审 所 涉及 的 最 重要 的 
流程 包括 如 下 几 个 方面 。 

e 000000000 

这 是 任何 系统 性 评审 的 起 始点 。 这 需要 把 一 个 公认 的 信息 需求 , 提炼 至 能 被 当前 研究 文 

献 所 回答 的 一 个 或 多 个 问题 。 

eUUUOO0OO0ODO0DO 

这 需要 一 个 研究 团队 尽 可 能 全 面 地 搜索 研究 文献 , 来 找到 解决 所 研究 问题 的 文章 。 有 时 
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修 , 需要 单个 研究 人 员 (如 一 个 博士 生 ) 独自 完成 这 项 任务 , 但 是 这 一 限制 可 能 导致 漏 掉 一 

些 相 关 的 文章 。 最 佳 实践 是 ， 研 究 过 程 中 识别 出 的 每 篇 文章 都 至 少 被 两 名 研究 人 员 检 查 过 ， 

他 们 各 自 评 全 这 篇 文章 是 个 应 该 被 系统 性 评审 所 包含 。 对 单 篇 文 草 的 不 同意 见 必须 在 讨论 后 

解决 (如果 需 要 的 话 ， 可 以 引入 第 三 名 团队 成 员 ) 。 

系统 性 评审 的 有 效 性 依赖 于 找到 足够 的 实证 研究 来 解决 所 研究 的 问题 , 并 且 证 明 人 研究 过 
程 符 合 系统 性 评审 所 要 求 的 完整 性 级 别 。 
*HUUUUUUUOL 

这 和 需要 确定 合适 的 标准 来 评估 每 项 研究 方法 的 严谨 性 , 并 依 此 确定 它 征 个 有 资格 被 包含 

到 文章 的 集合 中 。 我 们 希望 我 们 集合 的 文革 是 基于 最 高 质量 的 证 据 的 。 质 量 评估 是 困难 的 ， 

所 以 多 数 标 准 建议 由 至 少 两 名 研究 者 来 评估 每 项 研究 的 质量 ,并 且 通 过 讨论 来 解决 不 同意 见 。 

esUUUUUUDO 

这 需要 提取 每 篇 文革 中 针对 所 研究 回 题 数 据 ， 然 后 适当 地 集合 数据 。 有时， 可 以 通过 一 

次 正式 的 元 分 析 来 集合 数据 , 但 在 软件 工程 和 其 他 非 医学 领域 中 , 每 篇 饶 究 的 结 采 通常 只 十 

以 表格 的 形式 列 出 来 ， 以 确定 芍 在 的 趋势 。 与 质量 评估 一样 ,数据 捉 取 通 稍 由 两 名 研究 者 来 

完成 ， 他 们 讨论 并 解决 所 有 的 不 同意 见 。 

虽然 我 之 前 批评 了 对 专家 观点 的 依赖 ， 但 是 我 所 见 过 的 关于 软件 工程 的 最 好 的 系统 性 评审 ， 
征 由 包含 领域 专家 的 团队 执行 的 。 领 域 专家 的 知识 在 系统 性 评审 中 可 以 被 很 好 地 加 以 利用 , 来 确 
定 需 要 搜索 的 专业 会 议和 期 刊 ， 并 确定 可 以 用 作 基 维 的 一 组 功 始 研究 文 草 ,来 检查 任何 目 动 搜索 
过 程 的 有 效 性 。 

对 于 刚 开 始 学 习 系 统 性 评审 流程 的 新 研究 员 ， 我 推荐 他 们 沽 虑 图 畜 研 究 (mapping studies) 。 
这 类 系统 性 评审 试图 寻找 并 分 类 涉及 更 宽泛 研究 话题 的 文献 , 而 不 是 回答 一 个 特定 的 研究 问题 。 
这 两 类 人 研究 的 区 别 可 以 通过 比较 Magne Jorgensen 的 两 篇 文 划 而 看 出 。 第 一 篇 是 传统 的 系统 性 评 
审 , 调查 了 成 本 估算 模式 的 评估 在 预计 项 目 成 本 时 是 否 比 专家 判断 的 评估 更 精确 ” 。 这 篇 文章 在 
3.3.1 节 中 有 所 讨论 。 第 二 篇 是 高 质量 的 图 谱 研 究 ， 对 成 本 估算 文献 进行 了 分 类 ” 。 

下 面 的 3.3 太 讨论 了 一 些 挑 战 了 软件 工程 “和 识 ” 的 系统 性 评审 ， 证 明了 我 们 用 健全 方法 论 
来 集合 证 据 的 必要 。 然 而 ， 在 讨论 这 些 例子 之 前 ， 我 先 总 宽 一 下 系统 性 文献 访 程 。 

只 对 系统 性 评审 的 结 末 感 兴 趣 ， 而 对 系统 性 评审 的 具体 流程 不 感 兴 趣 的 读者 ， 可 以 直接 跳 至 
3.3 古 。 这 半 的 简介 应 该 足够 你 了 解 系 统 性 评审 流程 的 严谨 性 ， 不 用 你 多 花 力气 去 读 这 么 多 的 细 
Pe 

然而 ， 如 末 你 古 一 个 新 的 或 者 有 经 验 的 研究 者 ， 项 望 评估 系统 性 评审 的 价值 ， 那 你 就 需要 
阅读 下 一 三 。 它 讨论 了 系统 性 评审 流程 中 的 具体 步骤 , 并 告诉 你 这 一 方法 论 中 所 固有 的 一 些 实践 
困难 。 


3.2 系统 性 评审 的 长 处 和 短处 
随 着 时 间 的 推移 ,我 已 经 为 软件 工程 的 研究 者 们 定义 了 两 套 执行 系统 性 评审 的 标准 。 第 一 套 f 
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标准 基于 医学 系统 性 评审 , 而 第 二 套 在 第 一 套 的 基础 上 进行 了 修订 , 把 社会 学 研究 中 的 新 兴 想 
法 也 纳入 其 中 。” 

这 一 市 简短 地 概述 了 这 些 报 告 所 记录 的 指导 方针 。 然 而 , 我 提醒 读者 不 要 以 为 他 们 可 以 基于 
这 些 简短 概述 就 能 成 功 地 开展 系统 性 评审 。 你 应 该 阅读 完整 的 技术 报告 ， 参 考 其 他 文献 (比如 ， 
Fink''”, Higgins#fIGreen”!, Khan“ \.°?!PetticrewfRoberts“ 的 报告 )， 阅 读 系 统 性 评审 的 案例 ， 
包括 这 革 晚 些 时 候 会 讨论 的 软件 工程 的 委 例 。 如 果 你 能 查看 一 些 好 的 系统 性 评审 的 例子 ,你 就 会 
明白 它们 不 是 简单 形式 的 研究 。 它 们 需要 花 很 长 时 间 ， 也 需要 谨慎 地 计划 、 执 行 和 汇报 1。 


3.2.1 系统 性 评审 的 流程 


一 次 系统 性 评审 有 三 个 主要 阶段 : 计划 、 执 行 评审 和 汇报 结 朱 。 
1. 计划 评审 
这 一 阶段 的 步骤 包括 以 下 内 容 。 
*HUUUUUUU 

确定 必要 性 能 帮助 确定 评审 的 育 景 环境 ,能 对 所 研究 的 问题 给 予 约束 ， 或 者 对 包含 或 排 
除 原始 研究 的 标准 给 予 限制 。 例 如 ， 如 采 你 需要 确定 ?| 入 新 技术 的 了 其 佳 方法 ,也许 你 会 限制 
只 包含 产业 领域 的 研究 。 此 外 , 你 应 该 检查 是 个 有 现成 的 文献 已 经 对 此 话题 领域 进行 了 评审 ， 
如 有 有 的 话 ， 需 要 证 明 另 一 次 评审 的 必要 性 。 
eHUUU 

PEI AGL SS EE BCA MEE ANTAL E SRT ST ZS BSB ELSA AA SE PP. 7 
基金 组 织 通 常会 惑 请 了 解 主题 本 身 也 了 解 系 统 性 评审 的 专家 来 所 交 实 施 评审 的 提议 。 然 而 ， 
我 从 未 听 说 “授权 评审 ”这 一 步骤 在 软件 工程 中 发 生 过 。 
aa 

Ye) eH AEE SS A PE ate. 所 以 需要 有 清楚 的 书面 表达 , 并 让 所 有 的 评审 团 的 
成 员 都 理解 。 
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这 一 步骤 需要 确定 出 开展 评审 和 汇报 结果 时 将 要 使 用 的 所 有 流程 : 具体 研究 流程 , 包含 
和 排除 原始 研究 的 标准 , 以 及 提取 和 集合 的 流程 。 这些 都 需要 先 经 过 检验 来 确保 其 适用 于 将 
来 的 任务 。 评 审 协 议 是 用 来 减少 研究 偏见 的 一 种 方法 (因为 研究 策略 是 提前 定义 的 , 不 在 任 
何 一 个 研究 员 的 控制 范围 之 内 ) ， 并 能 增加 评审 的 可 审计 性 和 可 重复 性 (因为 计划 的 流程 需 
要 被 充分 报告 )。 这 是 一 项 非 第 耗 时 的 工作 。 
*HUUUUOL 

多 数 标 准 建议 团队 之 外 的 研究 者 来 评审 协议 。 然而, 在 实践 中 很 难 找到 外 部 的 研究 者 愿 
意 担任 这 一 角色 ， 所 以 可 能 只 会 有 一 次 内 部 的 评审 。 














O 这 些 报告 了 其 他 经 验 性 软件 工程 的 资料 可 以 在 网 站 http://www.ebse.org.uk 找 到 。 
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2. 执行 评审 
这 一 阶段 的 步 又 包括 如 下 内 容 。 
e 00000000L 

这 首先 需要 确定 文献 来 源 以 搜索 论文 , 然后 确定 如 何 组 织 搜索 , 最 后 确定 相关 研究 论文 。 
其 中 会 涉及 的 主要 问题 包括 : 选择 哪些 数字 图 书库 、 索引 系统 、 刊物 和 大 会 记录 来 进行 搜索 ， 
搜索 流程 是 目 动 化 的 、 手 动 的 、 还 古 混 合 的 ， 如何 保证 搜索 流程 的 有 效 性 。 找 到 相关 的 研究 
古 男 一 项 耗 时 的 活动 ， 我 们 之 后 会 详细 讨论 。 
sae 

选择 的 流程 指 , 运用 包含 和 排除 的 标准 来 决定 搜索 流程 确定 的 每 个 研究 是 否 被 包括 在 评 
FH 
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需要 对 原始 研究 进行 质量 评估 。 这 样 才能 只 包 
量 研 究 存 在 时 ， 对 读者 给 予 提醒 。 通 第 你 需要 一 份 
frieh], 

比如 ， 以 实验 做 例子 ， 标 准 的 问题 包括 : “研究 对 象 是 否 被 随机 分 配 于 治疗 中 ?”“ 研 
宛 者 古 合 在 实验 结束 之 前 不 知晓 研究 对 象 被 分 配 于 何 种 治疗 中 ? “对 于 软件 工程 中 的 系统 性 
评审 ， 可 以 使 用 许多 不 同 的 研究 方法 。 我 推荐 用 Dyb& 和 Dingseyr 制 订 的 清单 “作为 起 始点 ， 
虽然 我 更 倾 则 于 使 用 顺序 量 表 而 不 古 二 元 选择 来 回答 同 题 。 你 也 应 该 参 演 第 2 半 。 
esUUUUUUDO 

从 每 篇 文章 中 抽取 出 的 数据 必须 在 集合 后 才能 回答 所 人 研 究 的 问题 .如 条 有 是 够 的 可 比较 
的 定量 数据 ， 可 以 使 用 元 分 析 方 法 “。 如 果 疫 有 的 话 ， 结 果 应 该 制 成 表格 ， 以 某 种 方式 应 对 
所 研究 的 问题 。 

元 分 析 古 医疗 界 的 系统 性 评审 中 最 和 党 使 用 的 数据 集合 形式 , 但 在 其 他 领域 中 却 不 那么 凋 
见 。 实 践 中 ， 只 有 当 每 个 原始 研究 的 结 来 都 以 适当 的 统计 分 析 呈 现 的 时 候 ， 元 分 析 才 有 可 能 
性 。 然 而 ， 即 使 统计 结果 存在 ， 也 不 是 总 能 执行 完整 的 元 分 析 ，。 
3. 汇报 评审 
这 一 阶段 的 步 又 包括 如 下 内 容 。 
*HUUUUU 

一 些 系 统 性 评审 非 第 元 长, mA Ete 26 T te a eA PN R PE 
ASAE 
e O00000 

系统 性 评审 遵循 经 验 性 论文 的 普通 报告 标准 。 我 推荐 使 用 结构 式 概要 (如 Roberts 和 
Dalziel ”报告 中 所 用 ) ， 因 为 有 证 据 显 示 这 是 总 结 研究 结果 的 有 效 方法 “。 如 果 你 一 直 坚 持 
使 用 一 个 好 的 模式 ， 而 且 你 的 搜索 和 数据 提取 流程 保持 了 展 好 记录 ， 这 是 一 个 比较 人 简单 的 


任务 。 


含有 健全 方法 论 的 研究 ， 或 者 当 只 有 少 
质量 评价 问卷 ， 对 实证 研究 的 严谨 性 进 
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标准 流程 推荐 外 部 评审 , 但 不 管 系统 性 评审 是 在 内 部 还 是 外 部 被 评 佑 , 评审 者 需要 确认 
系统 性 评审 的 流程 被 完全 写 在 报告 中 ,而 且 所 研究 的 同 题 和 人 研究 的 流程 、 数 据 抽取 流程 、 数 
据 集 合流 程 之 间 有 直接 的 对 应 关系 。 


系统 性 评审 要 求 一 把: 结 末 征 可 重复 的 ， 束 是 说 如 末 另 一 个 研究 小 组 遭 循 同样 的 协议 ， 他 们 
会 得 到 同样 的 结 末 。 可 重复 性 依赖 于 所 人 研究 的 问题 本 映 的 清晰 明确 ， 不 能 模 楼 两 可 ， 也 需要 对 搜 
索 和 集合 的 流程 以 及 人 研究 的 冰 围 进行 完全 的 汇报 ,最近 有 个 研究 比较 了 两 个 针对 同样 研究 回 题 的 
独立 系统 性 评审 ” 。 这 份 研究 总 结 : 在 原始 研究 数量 较 少 而 评审 团 由 领域 专家 组 成 的 情况 下 ， 软 
件 工程 的 系统 性 评审 可 重复 性 相当 高 。 另 一 份 基于 非常 庞大 的 经 验 性 文献 库 的 系统 性 评审 ”发 现 
了 不 同文 献 中 的 评审 有 巨大 的 差异 , 但 它 同时 解释 说 这 些 差异 来 目 于 不 同 评审 中 隐 仿 的 研究 问题 
之 同 的 差异 。 


3.2.2 ”开展 一 项 评审 所 牵连 的 问题 


理论 上 说 ， 系 统 性 评审 应 该 严格 按照 预先 定义 好 的 研究 协议 展开 。 然 而 ， 这 并 设 有 看 起 来 那 
么 容易 。 虽 说 协议 是 被 测试 过 的 ， 但 是 它 可 能 没有 识别 出 设计 和 汇报 相关 原始 研究 的 所 有 变种 。 
所 以 , 你 可 能 碰 到 协议 所 没有 包 仿 的 情况 。 在 这 种 情形 下 , 协议 需要 修订 。 根据 不 同 修订 的 性 质 ， 
你 可 能 需要 评审 以 前 的 工作 甚至 重 做 许多 工作 ， 来 保证 其 符合 修订 后 的 协议 ” 。 

在 确定 相关 研究 的 过 程 中 , 关键 因素 是 选择 进行 搜索 的 数字 图 书馆 ， 还 要 确定 搜索 是 目 动 的 
还 是 手动 的 。 手 动 搜索 需要 查看 一 组 〈 纸 面 或 者 在 线 ) 期 刊 的 以 往 发 行 记 如 ,然后 从 标题 和 摘要 
中 确定 哪些 文章 能 够 被 候选 包含 在 评审 中 。 自 动 搜 索 使 用 字符 串 , 通常 是 基于 复 灯 布尔 公式 的 字 
符 串 ， 通 过 在 线 目录 查找 文章 。 在 医学 文献 中 ， 建 议 从 所 研究 的 问题 中 抽取 字符 串 做 搜索 。 

对 目 动 化 搜索 来 说 ，Hannay 等 人 推 存 仅 在 ACM 数 字 图 书馆 、IEEE Xplore、Compendex 和 1ISI 
科技 网 上 搜索 资料 ， 因 为 这 些 书 库 确保 涵盖 了 ACM、IEEE、Kluwer Online, Science Direct, 
SpringerLink 和 Wiley 的 资料 “ 。 作 者 们 也 推荐 对 重要 的 主题 大 会 刊物 进行 手动 搜索 。 然 而 ， 如 果 
你 需要 找到 所 有 相关 的 文献 ， 无 论 发 表 的 还 是 未 发 表 的 ， 你 也 应 该 使 用 Google 学 术 和 CiteSeer。 
此 外 , 不 同 的 数字 图 书馆 在 搜索 方式 上 有 一 些 细微 的 差别 。 所 以 ， 你 应 该 癌 图 书 管 理 员 咨 询 你 的 
搜索 流程 和 搜索 字符 串 ， 他 会 给 你 一 些 好 的 意见 。 相 关 的 问题 包括 如 下 内 容 。 

O 软件 工程 数字 图 书馆 有 不 同 的 界面 和 对 复杂 布尔 公式 的 不 同 容 差 ， 这 在 系统 性 评审 的 研 

究 者 寻找 相关 文章 时 会 经 第 过 到 。 

O 软件 工程 数字 图 书馆 对 于 搜索 论文 主体 ， 或 仅 搜 索 标 题 、 摘 要 和 关键 字 有 着 不 同 的 程序 。 

另外 ， 索 3| 系 统 当然 只 能 用 来 搜索 标题 、 关 键 字 和 摘要 。 

口 自动 化 搜索 不 同 的 资料 源 可 能 会 有 重合 的 结果 (也 就 是 说 ， 可 能 在 不 同 的 库 中 找到 相同 

的 论文 )， 而 且 每 次 搜索 都 会 包含 许多 无 关 的 论文 。 

对 于 手动 搜索 来 说 ,你 需要 选择 你 想 要 搜索 的 刊物 和 会 议 纪 录 。 当 然 ， 你 也 需要 证 明 你 的 选 

择 是 正确 的 。 然 而 ， 在 一 个 案例 分 析 中 ， 我 们 非常 惊讶 地 发 现 ， 有 和 针对 性 的 手动 搜索 比 泛 泛 的 日 
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动 搜索 要 快 许 多 …。 在 实践 中 ,你 很 可 能 需要 混合 策略 。 如 果 你 对 一 些 资料 进行 手动 搜索 后 ( 包 
括 专 家 会 议 的 会 议 纪录 ) ， 你 应 该 把 它 当 做 候选 原始 研究 的 一 组 基准 ， 基 于 这 组 基准 ， 你 可 以 验 
证 自动 化 搜索 字符 串 的 效用 。 另 一 种 方法 是 ， 领 域 专 家 也 可 以 把 一 组 论文 作为 确定 基准 。 

医疗 标准 强制 必须 有 两 个 研究 员 独 立 作 出 初始 的 对 于 包含 和 排除 的 决定 。 然 而, 我 在 软件 工 
程 中 的 目 动 化 搜索 经 验 是 , 许多 论文 单 从 标题 就 能 看 出 它 的 无 天性 。 因 此 ,在 实践 中 , 许多 软件 
工程 研究 者 (包括 我 自己 ) 允许 单个 研究 者 对 完全 无 关 的 论文 作出 初始 第 选 。 但 此 研究 者 必须 理 
解 ， 如 采 有 任何 疑问 ， 那 就 必须 把 论文 留 作 候 选 。 然 而， 在 下 一 步 的 旬 选 中 ， 有 两 个 或 多 个 研究 
者 独立 评估 每 篇 候选 的 原始 研究 是 很 重要 的 。 在 这 一 阶段 ， 人 研究 者 需要 完整 阅读 每 篇 候选 论文 ， 
用 包含 和 排除 的 标准 来 进行 筛选 。 

如 来 包含 同 一 项 研究 多 次 的 话 ,会 使 集合 产生 偏差 。 因 此 ， 必 须 检 查 每 篇 论文 来 确定 他 们 古 
合 包 含 多 重 研 究 ， 或 者 是否 因为 ?| 用 了 同样 的 研究 而 需要 融合 他 们 的 结 未 。 然 而 ， 要 识别 出 对 同 
一 篇 研究 的 重复 汇报 不 总 是 容易 的 事 。 在 近期 的 一 次 系统 性 评审 中 , 我 和 我 的 同事 们 必须 找 出 重 
复 的 样本 量 , 也 要 找 出 重复 作者 的 名 单 ， 以 便 确认 对 同一 篇 研究 的 重复 汇报 “。 在 其 他 系统 性 评 
审 中 ,问题 会 更 微妙 ， 因 为 不 同 的 研究 者 使 用 同样 的 数据 组 来 调查 同样 的 数据 分 析 方 法 , 但 不 总 
会 清楚 地 指出 他 们 所 使 用 的 数据 组 ”。 

医疗 标准 要 求 系统 性 评审 由 一 个 研究 团队 来 执行 。 这 是 因为 许多 流程 依赖 人 的 主观 判断 ， 特 








O 在 急 始 搜索 或 是 运用 包含 和 排除 的 标准 时 ， 决 定 一 篇 论文 是 否 成 为 原始 研究 的 候选 ， 

O 回答 质量 评估 的 问题 ， 

口 从 每 篇 原始 研究 中 抽取 数据 。 

让 多 个 研究 者 来 执行 系统 性 评审 是 希望 能 前 弱 个 人 判断 造成 的 偏差 。 一 开始 , 我 和 我 的 同事 
们 建议 采取 一 个 抽取 员 流 程 和 一 个 检查 员 流 程 , 那样 也 许 比 两 个 人 独立 抽取 数据 和 评估 质量 效率 
高 ”。 但 最 后 ， 这 被 证 明 是 个 错误 的 选择 ”。 然 而 ， 有 时 系统 性 评审 必须 由 单个 研究 者 来 完成 ， 
比如 为 研究 生 学 位 做 研究 , 或 者 当 人 手 有 限 的 时 候 。 淮 个 例子 ,我 在 时 间 紧 迫 和 资源 有 限 的 情况 
下 ,自己 完成 了 一 项 初步 图 谱 研究 “。 在 这 种 情况 下 , 研究 者 应 该 使 用 一 些 技巧 来 评估 主观 决定 
的 准确 性 ， 如 Fink 所 建议 的 测试 -再 测试 的 流程 "。 

最 后 ， 关 于 质量 标准 ， 我 发 现 很 少 有 软件 工程 的 系统 性 评审 真正 评估 了 各 个 单项 研究 的 质 
量 ““。 然 而 ,质量 判断 是 系统 性 评审 的 流程 中 不 可 缺少 的 元 素 ， 它 对 适当 地 集合 原始 研究 的 结 
本 和 解读 结 采 都 非常 重要 。 在 一 次 最 近 针 对 顺 劳 疗法 疗效 的 系统 性 评审 中 , 我 们 可 以 找到 低 质量 
对 研究 结果 影响 的 例子 “。 如 果 所 有 的 研究 都 被 包含 的 话 ， 顺 势 疗法 看 起 来 比 安奈 剂 更 有 效 。 但 
古 排 除 低 质 量 研究 的 系统 性 评审 清楚 地 显示 了 顺势 疗法 并 不 比 安慰 剂 更 有 效 。 我 之 后 会 讨论 一 个 
软件 工程 中 利用 低 质量 原始 研究 的 例子 。 


3.3 软件 工程 中 的 系统 性 评审 


在 这 一 草 中 ， 我 将 介绍 一 些 系统 性 评审 的 结 东 ， 它 们 对 “前 识 ” 提 出 了 挑 成 ， 而 且 在 茶 些 情 
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况 下 ， 使 我 被 过 改变 了 一 些 对 软件 工程 的 观念 。 
3.3.1 成 本 估算 研究 

成 本 估算 研究 经 营 汇 报 对 于 行业 数据 集 的 实证 研究 , 所 以 有 关 成 本 估算 的 研究 话题 显然 会 是 
系统 性 评审 的 候选 。 确 实 ， 一 次 针对 从 2004 年 1 月 至 2007 年 6 月 所 发 布 的 系统 性 评审 的 回顾 发 现 ， 
成 本 估算 的 话题 是 系统 性 评审 中 最 常见 的 主题 。 其 中 两 份 评审 特别 受 关 注 , 因 为 它们 颠覆 了 一 
些 我 们 对 软件 成 本 预 估 的 固定 思维 。 

1. 成 本 估算 模式 的 准确 性 

在 两 份 系统 性 评审 中 ，Magne Jorgensen 回 答 了 成 本 模型 估算 (从 过 去 项 目 中 收集 数据 ， 然 后 
基于 数据 生成 数学 公式 ) 是 否 比 专家 判断 估算 ( 基 于 软件 开发 者 和 管理 者 的 主观 意见 作出 的 估计 ) 
更 准确 的 问题 “1 。 自 从 Boehm 和 DeMarco' “在 20 世 纪 80 年 代 初 出 版 书籍 以 来 ， 成 本 估算 的 研 
究 者 们 清晰 地 表达 出 了 一 种 信仰 : 成 本 估算 模型 肯定 比 专家 判断 更 好 。 但 是 Jorgensen 的 评审 首次 
试图 确定 这 种 信仰 是 否 有 经 验 性 证 据 所 文 摊 。 

在 他 的 研究 报告 中 ，Jorgensen 找 到 了 15 份 比较 了 专家 判断 模式 和 成 本 估算 模式 的 原始 研 
究 。 他 把 $ 份 归 类 为 支持 专家 判断 ，5$ 份 归 类 为 无 差别 ， 另 $ 份 归 类 为 支持 基于 模型 的 预 估 。 在 他 
文 后 的 研究 中 一 ， 他 确定 了 16 项 比较 专家 判断 估算 和 正规 成 本 模型 的 原始 研究 。 他 发 现 ,在 其 中 
的 12 篇 研究 中 ， 专 家 判断 模式 的 平均 准确 率 显得 更 高 。 

这 两 份 系 统 性 评审 的 区 别 反映 了 入 选 研究 的 区 别 和 评审 侧重 点 的 区 别 。 在 更 近 的 那 篇 系统 性 
评审 中 , 他 排除 了 三 篇 在 第 一 次 系统 性 评审 中 所 包含 的 原始 研究 , 并 包含 了 四 篇 其 他 的 原始 研究 。 
选择 不 同 研究 的 原因 是 ,第 一 份 系统 性 评审 旨 在 证 明 改 进 专家 主观 估算 程序 的 必要 性 ， 第 二 份 系 
统 性 评审 希望 识别 出 专家 意见 估算 和 正规 模式 估算 在 何 种 情况 下 比 另 一 种 更 好 。 然 而 , 尽管 两 份 
系统 性 评审 存在 区 别 ， 结 果 却 清晰 地 显示 成 本 模式 估计 不 一 定 比 专家 判断 估计 更 好 。 

至 于 可 能 存在 的 论文 中 “相关 研究 ”章节 的 偏见 ， 我 在 此 声明 ,我 合 著 的 一 篇 论文 被 同时 
包含 在 Jorgensen 的 两 篇 系统 性 评审 中 。 在 我 们 的 论文 中 ,我 和 我 的 同事 只 确定 了 Jergensen 所 找到 
的 2002 年 前 发 布 的 12 篇 论文 中 的 两 篇 。 两 篇 文章 都 发 现 专家 判断 比 基 于 模型 的 估算 更 好 ， 这 和 我 
们 自己 发 现 的 一 样 。 

2. 业界 成 本 估算 的 准确 性 

1994 年 Standish Group 发 布 的 CHAOS 报 告 “显示 : 软件 行业 的 项 目 平均 超支 189%, MAR 
16% 的 项 目 是 成 功 的 (在 预算 内 且 按 时 完成 ) 。Standish Group 之 后 的 报告 发 现 超支 率 有 所 降低 ， 
且 有 34% 的 项 目 成 功 。 这 些 改变 已 经 使 观察 者 们 欢呼 稚 跃 , 因为 它 显示 了 软件 工程 技术 正在 改善 。 
然而 ， 当 Molekken-@stvold 和 Jergensen 着 手 对 软件 工作 量 估算 的 研究 文献 进行 评审 后 “| 发现， 
CHAOS 报 告 之 前 已 经 有 三 项 调查 发 现 了 平均 超支 率 为 30% 一 50%。 这 和 CHAOS 报 告 的 结果 差别 
很 大 。 因 此 他 们 仔细 审阅 了 CHAOS 报 告 ， 试 图 理解 为 什么 超支 率 会 那么 高 。 经 过 调查 之 后 ， 他 
们 把 CHAOS 报 告 从 他 们 的 调研 中 去 除 挥 了 。 

他 们 对 CHAOS 报 告 的 具体 调查 细节 在 他 们 的 报告 “中 有 所 呈现 。 他 们 发 现 了 Standish Group 
使 用 的 方法 论 有 许多 不 足 之 处 : 
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O 没有 详细 说 明 计 算 超支 率 的 方法 。Molekken-@stvold 和 Jgrgensen 运 行 日 己 的 计算 方法 时 ， 
他 们 发 现 超支 率 应 该 更 接近 89%， 而 不 是 189%; 
O Standish Group 似乎 有 故意 寻找 失败 案例 之 嫌 ; 
O 没有 低 于 预算 完成 项 目的 分 类 ， 
D ZARIE EX, 超 文 ”可 能 包含 了 已 取 销 的 项 目的 成 本 。 
他 们 上 总 结 说 ， 虽 然 CHAOS 报 告 是 最 经 党 被 3| 用 的 天 于 预算 超支 的 论文 之 一 ， 它 的 结果 却 不 
可 信 。 


3.3.2 ”敏捷 方法 


当前 , 无 论 是 在 产业 界 还 是 学 术 界 ,许多 人 都 热衷 于 敏捷 方法 。 敏捷 方法 则 在 尽快 交付 匹配 
用 户 需 求 的 应 用 ， 并 同时 确保 高 质量 。 许 多 不 同 的 方法 被 归 在 敏捷 这 一 大 标题 下 , 但 是 他 们 都 强 
调 最 小 化 不 必要 的 管理 开支 (也 就 是 过 度 的 计划 和 文档 ) , 而且 聚 焦 在 增 量 交 付 特定 于 客户 的 功 
能 上 。 下 面 介 绍 一 些 广为人知 的 方法 。 
e 00000 XPU XP 
初始 的 XP 方法 包括 12 项 实践 : AMR. AT. m. mii WE., E 
构 、 结 对 编程 、 集 体 所 有 权 、 持 续集 成 、 每 周 40 小 时 、 现 场 客 户 和 编码 规范 。 修 订 的 XP2 
方法 包含 以 下 “主要 实践 ”: 坐 到 一 起 、 完 整 团 队 、 富 伟 信 息 的 工作 空间 、 充 满 活 力 的 工作 、 
结对 编程 ， 故 事 ， 周 循环 ， 季 度 人 循环， 松弛 ，10 分 钟 构建 ， 持 续集 成 ,测试 先行 编程 ， 增 量 
设计 中。 
e Scrum 
这 种 方法 关注 在 难以 提前 计划 的 情况 下 ， 采 用 “经 验 性 流程 控制 (empirical process 
control) ”的 机 制 进行 项 目 管理 ， 关 注 反 馈 周 期 。 软 件 由 自 组 织 团 队 以 增 量 方式 开发 (被 称 
为 “冲刺 ) ， 每 个 冲刺 由 计划 开始 ， 以 评审 结束 。 需 要 实现 的 系统 功能 在 一 份 代办 列表 中 
注册 。 然 后， 产品 负责 人 决定 哪 项 代办 列表 条 目 需 要 在 下 个 冲刺 中 被 开发 。 团 队 成 员 在 每 天 
的 站 立会 议 中 协调 他 们 的 工作 。 有 一 个 团队 成 员 作为 Scrum 主 管 ， 负 责 和 解决 阻碍 团队 高 效 工 
作 的 障碍 。 
e000000000DSDMD™ 
这 种 方法 将 项 目 分 成 三 个 阶段 : 项 目前 期 、 项 目 生 命 周 期 和 项 目 后 期 。 它 基于 9 个 原则 : 
用 户 必 须 持续 参与 ， 授予 团队 以 权力 ,注重 产品 的 经 营 交 付 , 满足 现存 业务 需求 ， 磷 代 和 增 
量 式 开发 ， 人 允许 开发 过 程 中 的 所 有 变化 可 逆 ， 在 高 层次 上 制定 需求 的 基线 ,测试 目 始 目 终 贯 
罕 于 开发 周期 之 中 ， 项 目 所 有 小 众 则 的 通力 合作 与 沟通 。 
e 000000“ 
这 种 方法 调整 了 精益 生产 中 的 原则 (特别 是 直 田 生产 系统 ), 使 之 适应 于 软件 开发 。 它 包 
分 7 项 原则 :消除 浪费 ， 增 强 学 习 ， 延 述 决 策 ， 快 速 交 付 ， 授 权 团队 ， 般 入 质量 ， 整 体 优化 。 
O 系统 性 评审 可 能 存在 的 局 限 性 之 一 ， 是 它们 产生 价值 的 进度 可 能 太 慢 ， 以 至 于 跟 不 上 如 
软件 工程 这 样 快 市 和 的 领域 。 然而 , 最 近 已 经 有 两 项 针对 于 敏捷 方法 的 系统 性 评审 : Dyba 
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和 DingsgyV 的 报告 '“， 以 及 Hannay 等 人 的 报告 “|。 

1. Dyba 和 Dingsgyr 

这 些 研究 者 "有 三 个 目标 : 

O 评估 当前 对 敏捷 方法 的 益处 和 局 限 性 的 知识 ， 

O 评估 知识 背后 的 证 据 的 强度 ，; 

O 在 产业 界 和 科研 社区 .应 用 研究 结果 。 

他 们 关注 敏捷 开发 的 整体 ， 所 以 排除 了 调查 特定 方法 的 论文 ， 如 孤立 结对 编程 的 研究 。 他 们 
确定 了 33 个 相关 的 原始 研究 ， 其 中 大 部 分 研究 (24 项 ) 调查 了 专业 软件 工程 师 。 而 另外 9 项 在 大 
学 环境 下 展开 。 

关于 系统 性 评审 和 非 正 却 评审 的 区 别 ，Dyba 和 Dingseyr 报 告 称 发 现 了 5 篇 在 2003 年 及 以 六 发 
表 的 论文 ， 并 未 在 2004 年 发 布 的 两 篇 非 正 式 评 审 中 包含 。 出 于 对 高 质量 证 据 的 需求 ， 他 们 否决 了 
两 次 韭 正 式 评 审 中 所 汇报 的 所 有 论文 ， 因为 它们 要 么 是 经 验 学 习 的 论文 , 要 么 就 是 针对 单个 实践 
的 人 研究， 而 并 没有 与 其 他 可 碗 方法 比较 所 关注 的 技巧 。 

Dyb&a 和 Dingseyr 发 现 ， 虽 然 一 些 研究 汇报 了 XP 存 在 的 问题 (在 大 而 复杂 的 项 目 背 景 下 ) , 大 
多 数 讨论 XP 的 论文 发 现 它 容易 ?| 入 而 且 在 不 同 环境 下 都 运作 民 好 。 至 于 XP 的 局 限 性 ， 他 们 发 现 
有 一 些 原始 研究 汇报 了 现场 客户 这 个 角色 从 长 期 来 看 不 可 行 。 

然而 ， 他 们 从 敏捷 方法 的 实证 研究 中 找 出 了 许多 局 限 性 。 大 部 分 研究 只 关心 XP， 而 Scrum 和 
精益 软件 开发 分 别 只 有 1 篇 论文 讨论 到 。 而 且 ， 只 有 一 个 研究 小 组 (被 包含 的 原始 研究 中 有 4 篇 是 
他 们 完成 的 ) 检测 了 成 熟 团队 使 用 敏捷 方法 的 情况 。 

此 外 ，Dyba 和 Dingseyr 从 不 同 角度 评估 了 现存 证 据 的 质量 ， 包 括 了 研究 设计 的 严谨 性 、 单 个 原 
始 研 究 的 质量 (在 基本 设计 的 约束 下 ) 、 不 同 研 究 的 结果 一 致 程度 、 以 及 研究 对 真实 软件 开发 的 
代表 性 。 他 们 发 现 ， 证 据 的 总 体质 量 很 低 ， 而 且 他 们 总 结 出 ， 除 了 XP 以 外 的 其 他 敏捷 方法 需要 
更 多 的 研究 ， 特 别 是 针对 成 熟 团队 的 研究 ， 因 为 研究 者 可 以 使 用 更 严谨 的 方法 。 

2. Hannay、Dyb&a、ArisholIm 和 Sjgberg 

这 些 研究 者 “研究 了 结对 编程 并 开展 了 一 次 元 分 析 来 集合 研究 结果 。 如果 你 对 如 何 做 元 分 析 
感 兴趣 的 话 ， 这 篇 论文 提供 了 可 徘 的 介绍 。 他 们 的 系统 性 评审 确定 了 18 项 原始 研究 ， 全 部 都 是 实 
验 。18 项 研究 中 ，4 项 实验 只 涉及 专业 对 象 ，1 项 同时 涉及 专业 人 员 和 学 生 ， 其 他 13 项 用 学 生 做 人 研 
究 对 象 。Hannay 等 人 调研 了 3 种 不 同 的 结果 : 质量 、 持 续 时 间 和 工作 量 (虽然 不 是 每 项 研究 都 处 
理 了 所 有 结果 ) 。 他 们 的 初始 分 析 显 示 ， 使 用 结对 编程 有 以 下 效 末 : 

口 对 质量 的 少许 正面 彩 啊 ; 

O 对 持续 时 间 的 中 等 正面 效 末 ， 

口 对 工作 量 的 中 等 负面 效果 。 

这 些 结果 似乎 支持 对 结对 编程 影响 的 标准 观点 。 然 而 ,结果 也 指出 ,研究 之 间 有 显著 的 混杂 
性 。 混 困 性 指 个 体 研 究 从 不 同 的 人 群 出 发 ， 因 此 研究 结果 不 能 被 很 好 地 理解 ， 除 非 能 识别 出 不 同 
HY ABE 

Hannay 等 人 在 调查 发 表 偏 侍 (publication bias) 的 可 能 性 时 发 现 了 更 多 问题 。 这 指 表现 出 显 
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能 性 ， 并 发 现 如 有 根据 可 能 的 仿 傈 做 出 调整 的 话 ， 那 对 质量 的 效 朱 就 完全 抹 去 了 ， 对 持续 时 间 的 
效果 会 从 中 等 变 成 少许 , 但 是 对 工作 量 的 效 末 会 有 一 点 增加 《虽然 这 仅 发 生 在 一 项 特别 的 分 析 模 
Pa 

他 们 指出 , 混杂 性 和 可 能 存在 的 发 表 偏 倚 可 能 古 由 干扰 变数 EEA RAER A] 
差异 的 变数 ) 的 存在 所 导致 的 。 为 了 研究 可 能 的 干扰 变数 的 影响 ， 他 们 仔细 碍 看 了 一 项 研究 。 那 
征 迄 今 为 止 最 大 的 一 项 研究 ， 涉 及 295 个 对 象 ， 使 用 了 三 个 级 别 的 专业 软件 工程 师 〈 高 级 、 中 级 
和 初级 ) 。 他 们 总 结 ， 任 务 的 复杂 性 和 结 末 之 间 可 能 存在 相互 作用 。 所 以 很 复杂 的 任务 可 能 在 使 
用 结对 编程 时 能 以 大 工作 量 为 代价 达到 高 质量 ， 而 低 复 杂 度 的 任务 可 能 以 低 质 量 为 代价 迅速 完 
成 。 他 们 推 存 研究 者 在 将 来 的 原始 研究 中 关注 干扰 变数 。 

Dyba 和 Dingseyr 的 研究 显示 可 以 从 敏捷 方法 中 获得 一 些 益 处 “。 然 而 , Hannay 等 人 的 元 分 析 
显示 , 结对 编程 的 效果 可 能 不 如 期 望 的 来 得 强 “。 总 体 看 来 , 两 篇 研究 的 结果 都 显示 出 敏捷 方法 
的 影 啊 力 需 要 更 多 的 研究 ， 而 且 我 们 需要 普遍 提高 原始 饶 究 中 使 用 的 研究 方法 。 


3.3.3 ”检验 方法 


检验 技巧 是 指 那 些 以 识别 缺陷 为 目的 的 阅读 代码 和 文档 的 方法 。 他 们 可 能 是 被 研究 最 多 的 经 
验 性 软件 工程 的 话题 之 一 。 在 1993 年 到 2002 年 之 间 ， 开 展 了 103 项 以 人 为 中 心 的 实验 “， 其 中 37 
项 (36%) 研究 是 关于 检验 的 。 其 次 是 面向 对 象 (00) 设计 的 类 别 ， 占 据 了 103 篇 论文 中 的 8 篇 
(7.8%) 。 因 此 ， 检 验方 法 看 似 是 强 有 力 的 系统 性 评审 候选 。 

最 过，Ciolkowski 开 展 了 一 项 包括 元 分 析 的 系统 性 评审 ,来 测试 关于 基于 视角 阅读 (perspec- 
tive-based reading, PBR) 的 主张 站，、 比 如， 许多 研究 者 暗示 PBR 比 专案 阅读 (ad-hoc reading) 
和 基于 清单 阅读 (checklist-based reading, CBR) 都 要 好 。 而 且 在 一 次 电子 研讨 会 中 ， 与 会 专家 
把 影响 评估 为 35% 左 右 1。 而 其 他 研究 者 对 此 没 那 么 热情 。Wholin 等 人 开展 了 一 次 研究 调查 来 
定量 集合 检验 方法 的 可 行 性 ， 并 得 出 了 CBR 是 最 有 效 技巧 的 结论 |。 

Ciolkowski 的 初始 元 分 析 发 现 PBR 没 有 显著 影响 。 结 果 显 示 了 小 到 中 等 的 混杂 性 。 一 个 子 集 
分 析 显 示 了 PBR 比 专 委 阅读 强 ， 而 CBR 在 阅读 需求 文档 方面 比 PBR 强 ， 在 阅读 设计 文档 方面 比 
PBR 弱 。 他 也 广 明 了 结 末 受 干扰 变数 的 影响 ， 比 如 检查 材料 的 出 处 ， 以 及 研究 是 否 由 独立 研究 组 
所 执行 。 总 体 说 来 ， 使 用 同样 材料 和 同样 研究 组 的 研究 相 比 独立 研究 更 支持 PBR， 虽 然 子 群 分 析 
不 太 健 人 全。 即便 如 此 ， 他 也 总 结 道 ，PBR 能 增加 35% 性 能 的 说 法 是 不 被 证 实 的 。 


3.4 结论 


在 之 前 的 章节 中 ,我 讨论 了 一 些 对 软件 工程 提供 新 见解 的 系统 性 评审 。 在 过 去 几 年 中 , 许多 
其 他 系统 性 评审 和 图 谱 研 究 已 经 涵盖 了 各 方面 的 话题 ( 详 见 ，Kitchenham 等 人 2009 年 3 和 2010 
年 4 的 报告 ITS 的 虚拟 特刊 *»， 以 及 第 12 章 ) 。 我 相信 这 些 研究 应 该 能 开始 改变 我 们 在 软件 工程 
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领域 做 研究 的 方法 。 任何 对 特定 话题 感 兴趣 的 人 都 应 该 查看 针对 这 一 话题 的 系统 性 评审 。 如 果 系 
统 性 评审 不 存在 ， 也 许 做 一 次 会 是 个 好 主意 。 如 果 已 有 现存 的 评审 ， 他 们 可 以 作为 你 自己 文献 搜 
索 的 起 始点 ， 也 可 以 把 你 指 问 那些 需要 新 研究 的 话题 领域 。 

然而 , 系统 性 评审 也 有 显而易见 的 局 限 性 。 一 份 称 为 系统 性 评审 的 东西 不 一 定 保证 是 一 份 高 
质量 的 评审 。 在 阅读 系统 性 评审 的 时 候 ， 你 应 该 和 阅读 其 他 论文 一 样 保持 批 判 的 眼光 。 你 可 以 使 
用 Greenhalgh 的 评估 标准 … ， 或 者 评价 与 传播 中 心 所 使 用 的 5 项 标准 “。 

O 评审 的 选 定 和 排除 标准 是 否 有 适当 的 描述 ? 

口 文献 搜索 是 否 涵盖 了 所 有 相关 研究 ? 

口 研究 是 否 是 合成 的 ? 

O 评审 者 是 否 评估 了 被 选 定 研究 的 质量 和 有 效 性 ? 

O 基本 的 数据 和 研究 是 否 被 充分 地 描述 ? 

系统 性 评审 的 第 二 大 问题 是 对 高 质量 原始 研究 的 依赖 。 之 前 章节 中 讨论 的 研究 显示 ， 虽 然 原 
始 研究 的 数量 相对 较 多 ,， 但 是 质量 却 是 个 疑问 。 对 于 系统 性 评审 来 说 ,我们 需要 符合 如 下 标准 的 
原始 研究 : 

口 符合 所 研究 类 型 的 最 佳 质 量 的 指导 方针 ，; 

O 汇报 结 末 时 包含 充分 的 细节 ， 以 便于 元 分 析 的 进行 ; 

O 研究 群 组 和 研究 材料 上 相互 独立 〈 与 Basili 等 人 所 建议 的 实验 家 族 相 反 ” ) ; 

O 收集 有 关 可 能 的 干扰 变数 的 数据 ， 如 ， 研 究 对 象 的 类 型 和 经 验 ， 任 务 复杂 度 、 大 小 和 持 

续 时 间 。 

此 外 , 即使 对 以 人 为 中 心 的 方法 的 原始 研究 采用 了 这 些 最 佳 实践 ,我 依然 坚信 除非 我 们 能 在 
现实 情况 下 使 用 专业 的 研究 对 象 ， 基 于 元 分 析 的 集合 才能 够 可 靠 地 评估 一 项 方法 和 技巧 的 影响 
(也 就 是 ， 完 成 和 现实 情况 中 同样 复杂 度 和 持续 周期 的 任务 )。 

然而 ， 即 使 原始 研究 和 对 元 分 析 结 果 的 解读 有 些 回 题 ， 对 我 来 说 ， 实 证 研究 的 意义 就 在 于 ， 
把 实证 研究 方法 和 技巧 的 结果 组 织 进 一 个 经 验 性 知识 体 。 男 外 ,我 们 需要 采取 系统 性 评审 的 规则 
来 保证 我 们 公平 公开 地 集合 我 们 的 成 果 。 
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人 们 总 古 相 信和 数字 。 数 字 古 计算 机 学 的 核心 ， 金融 学 的 基础 ， 也 是 过 去 一 个 世纪 中 人 类 进步 
的 重要 组 成 部 分 。 对 于 现代 社会 中 的 大 部 分 人 来 说， 数字 还 是 认识 事物 的 方法 : 我 们 使 用 数字 来 
研究 约 物 的 安全 性 ， 也 用 它 来 研究 哪 种 政策 比较 好 ， 还 用 它 来 研究 宇宙 的 演变 。 数 字 也 许 征 人 类 
最 踢 大 最 有 效 的 工具 之 一 。 

但 征 和 所 有 的 工具 一 样 ， 数 字 也 有 其 允 点 。 有 的 问题 用 数字 束 很 难 回答 。 比 如 说 ，20 世 纪 80 
年 代 的 公共 卫生 研究 员 们 曾 想 找 出 为 什么 疾病 病人 很 难 按时 吃 药 。 他 们 计算 了 未 能 按时 吃 药 的 人 
数 ,并 用 统计 学 的 方法 找 出 了 按时 和 不 按时 吃 药 的 病人 的 区 别 , 其 至 进行 了 超 长 期 对 比 研 究 实验 ， 
以 找 出 不 按时 吃 药 的 后 条。 但 征 这 些 方法 并 不 能 解释 病人 不 能 按时 吃 药 的 原因 一 一 人 它们 只 能 用 严 
谭 的 口吻 来 招 述 一 些 明 摆 厦 的 事实 。 

后 来 ， 另 一 群 研究 员 用 完全 不 同 的 方式 进行 了 一 次 革命 性 的 研究 “。 研 究 员 们 没有 去 做 计算 
和 统计 ， 而 征 对 疾 痢 病人 进行 了 80 次 访谈 ， 询 问 这 些 受 访 者 在 什么 时 候 会 总 记 吃 约 。 节 后 他 们 发 
现 不 按时 吃 药 的 原因 并 不 古 因 为 病人 不 理智 或 者 反复 无 篆 ， 而 古 因 为 病人 目 己 故意 不 了 。 比 如 ， 
有 的 病人 明白 这 些 约 物 可 能 会 让 人 产生 依赖 性 , 所 以 就 有 意识 地 克制 了 药物 的 使 用 以 免 产生 抗 约 
性 。 在 公共 卫生 的 领域 中 ,这 样 的 人 文 研 究 在 当时 征 头 一 遭 ， 而 研究 的 结 未 也 极 大 地 推动 了 疾病 
病症 给 药方 式 的 改革 。 

这 些 和 软件 开发 有 哈 关 系 ? 和 公共 卫生 一 样 , 软件 开发 也 充满 了 很 多 “为什么” 和 怎么 办 
的 问题 ,这 些 问 题 无 法 用 数字 和 统计 来 解决 。 比 如 ， 如 来 你 古 一 个 软件 开发 团队 的 管理 者 ， 你 可 
能 第 会 同上 自 己 一 些 同 题 。 为 什么 我 的 开发 人 员 不 愿意 写 单元 测试 ?为 什么 用 户 总 古 填 错 这 个 表 
单 ? 为 什么 有 的 开发 人 员 的 效率 是 其 他 人 的 10 倍 ? 这 些 问题 无 法 用 数字 来 回答 , 但 是 如 采 我 们 能 
小 心地 运用 定性 研究 的 方法 ， 束 可 以 回答 它们 。 

但 是 定性 研究 方法 并 不 是 说 简单 地 问 人 们 一 些 问题 就 行 了 , 阅读 定性 研究 报告 也 不 像 阅读 研 
究 摘 要 那么 简单 。 本 章 将 介绍 什么 是 定性 研究 方法 ， 如 何 来 解读 定性 研究 的 结 采 ， 以 及 如 何在 自 
己 的 工作 中 应 用 这 些 方 法 来 提升 软件 开发 流程 以 及 软件 的 质量 。 
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4.1 何 为 定性 研究 方法 


简单 地 说 ， 定 性 研究 方法 指 系统 地 收集 和 解读 非 数字 的 数据 〈 包 括 文字 、 图 片 等 )。 和 定量 
研究 方法 一 样 ， 定 性 研究 方法 可 以 收集 数据 来 证 实 或 者 推翻 一 个 观念 (使 用 演绎 推理 法 ) 。 此 外 ， 
定性 方法 还 可 以 用 于 支持 归纳 推理 法 : 收集 数据 以 便 能 提出 新 的 解释 。 由 于 定性 研究 法 收集 的 是 
非 数字 的 数据 ， 所 以 这 种 方法 的 使 用 场景 也 更 加 自然 

为 了 解释 这 一 点 ， 让 我 们 看 看 一 个 案例 ， 并 讨论 如 何 使 用 定性 研究 的 方法 来 理解 它 。 想 象 你 
刚刚 接管 了 一 个 软件 开发 团队 。 你 现在 正 领导 团队 进行 一 个 新 项 目 , 而 这 个 项 目 刚刚 配备 了 一 个 
新 的 bug 跟 踪 系统 ， 包 含 了 很 多 你 的 团队 想 疯 了 的 新 功能 。 在 接 下 来 的 几 个 月 里 ， 你 看 到 你 的 团 
队 不 停 地 对 代码 修 修补 补 ， 进 度 喜人 ， 但 是 每 次 你 检查 新 系统 中 的 bug 列 表 时 ， 却 只 有 少量 报告 
存在 ， 它 们 都 是 由 少数 几 个 测试 人 员 提交 的 ， 而 且 似乎 始终 是 这 几 个 人 。 后 来 有 一 天 早上 ， 你 走 
到 你 手下 最 好 的 开发 人 员 的 办 公 桌 前 ， 却 发 现 他 的 屏幕 上 显示 的 是 旧 的 bug 追 踪 系统 。 你 的 团队 
原来 一 直 在 暗中 使 用 旧 系统 ! 有 了 全 面 的 培训 和 小 心 的 过 渡 ， 而 且 软 件 的 许可 费用 也 很 贵 ， 为 什 
么 开发 人 员 们 不 用 新 系统 呢 ? 

很 明显 我 们 可 以 直接 问 。 比 如 ， 你 可 以 召集 一 个 会 议 ， 并 询问 团队 为 什么 不 用 新 系统 。 你 
可 能 会 得 到 一 些 解释 ， 但 是 这 些 解释 未 必 完 全 可 信 ， 尤 其 是 在 开发 人 员 发 现 他们 自己 正在 性 北 
你 的 意见 的 时 候 。 此 外 ， 由 于 他 们 处 在 特定 社会 环境 中 ， 所 以 比较 内 向 的 成 员 可 能 就 不 会 开口 
说 话 ， 那 么 你 得 到 的 解释 就 只 是 那些 说 话 最 多 的 成 员 的 一 面 之 辞 。 勉 强 而 又 不 全 面 的 解释 没有 
任何 用 处 。 

要 想 跳出 这 个 圈套 ,你 可 以 让 一 个 你 信任 的 朋友 在 休息 时 间 四 处 打听 ， 简短 地 非 正 式 采访 一 
下 这 些 开发 人 员 。 这样 开发 人 员 们 都 不 必 当 着 大 家 的 面 来 表达 自己 的 想法 ,说 出 来 的 话 就 可 能 
多 ， 也 更 诚 悬 。 但 是 局 限 性 仍然 存在 ， 得 出 的 观点 仍然 局 限于 你 朋友 的 朋友 的 意见 。 更 惨 的 是 ， 
你 的 朋友 本 身 就 可 能 不 公正 。 可 能 他 自己 就 很 讨厌 新 的 系统 ,并 在 报告 给 你 的 时 候 不 自觉 地 偏向 
于 一 边 。 

刚刚 我 所 说 的 方法 的 问题 在 于 ， 得 到 的 数据 可 能 是 二 手 甚至 是 三 手 的 。 在 理想 的 情况 下 , 你 
应 该 能 自己 观察 到 最 有 意义 的 时 刻 。 比 如 ， 当 开发 人 员 决定 使 用 旧 系统 而 不 是 新 系统 的 时 候 ， 他 
们 在 想 些 什么 ? 他 们 有 哪些 时 间 上 的 压力 ? 他 们 在 和 哪些 人 合作 ? 他 们 输入 了 哪些 数据 ? 为 了 
找到 答案 ， 你 可 能 需要 在 开发 人 员 身 边 坐 一 整 天 ， 看 看 他 们 在 做 什么 。 这 样 你 就 能 直接 观察 到 他 
们 决定 放弃 新 系统 ， 使 用 旧 系 统 的 那 一 瞬间 。 

当然 ， 想 要 直接 观察 到 开发 人 员 的 这 些 瞬 间 通 常 是 不 现实 的 。 人 不 喜欢 被 监视 ， 而 且 经 常会 
调整 自己 的 行为 以 保护 隐私 、 吕 免 利 这 或 者 解除 焦虑 情绪 。 此 外 ， 由 于 你 是 唯一 的 观察 者 ， 你 很 
可 能 会 把 你 自己 的 偏见 也 带 进来 。 

我 们 还 可 以 把 开发 人 员 从 这 个 方法 中 完全 吻 除 出 来 ,只 研究 文档 。 开发 人 员 们 在 旧 系 统 中 报 
告 了 哪些 bug, 又 在 新 系统 中 报告 了 哪些 bug? 这 样 我 们 也 许可 以 发 现 开发 人 员 不 愿 在 新 系统 中 报 
告 的 bug 类 型 。 这 样 你 也 许可 以 找到 一 些 使 用 旧 系 统 的 原因 ， 但 是 真正 的 原因 仍然 存在 于 团队 成 
员 的 头脑 之 中 。 
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上 述 几 种 部 是 定性 研究 的 方法 ,他 们 部 有 各 目的 局 限 性 。 要 想 解 决 这 些 限 制 , 我 们 就 必须 接 
受 它 们 : 只 用 一 个 方法 无 法 揭示 完整 而 不 俩 不 倚 的 事实 。 好 的 人 文 研 究 会 结合 多 种 方法 ， 并 将 各 
种 方法 得 出 的 证 据 结 合 在 一 起 。 举 例 来 说 ， 比 如 你 既 对 员工 们 进行 了 访谈 ， 又 调查 了 哪些 pug 征 
在 新 系统 中 提交 的 。 两 种 方法 给 你 的 结论 虽然 不 同 , 但 相互 之 间或 多 或 少 的 有 一 臻 性。 通过 对 比 
这 些 结论 的 相同 点 和 不 同 点 ， 你 就 可 以 了 解 到 这 个 问题 的 真正 答案 。 

除了 调查 了 解 事实 之 外 ， 定 性 调查 还 可 以 让 我 们 进行 换 位 思 芳 。 很 多 时 候 ， 沟 通 不 畅 、 违 
反 流程 、 士 气 低落 部 是 因为 人 无 法 从 别人 的 角度 来 看 世界 。 而 这 也 正 古 定性 研究 想 要 解决 的 问 
题 。 这 种 换 位 思考 往往 就 是 定性 研究 方法 的 目标 。 比 如 说 ， 你 管理 着 一 个 团队 ， 发 现 每 周 五 都 
会 出 现 编译 错 误 ， 人 们 整 天 都 在 解决 这 个 问题 ， 每 个 人 回 家 的 时 候 都 很 昧 。 使 用 定性 研究 的 方 
法 来 调查 这 个 问题 你 可 能 会 发 现 原来 星期 四 晚上 大 家 都 在 忙 着 提交 修改 ， 因 为 周 五 是 你 决定 开 
会 的 日 子 。 有 了 这 样 的 调 碍 方法 ， 你 就 可 以 从 开发 人 员 的 角度 来 看 这 个 世界 并 找到 让 大 家 都 请 
意 的 解决 方案 。 


4.2 如何 解 读 定 性 研究 


在 了 解 了 什么 是 定性 研究 方法 之 后 , 我 们 现在 将 介绍 一 下 如 何 来 解读 定性 研究 (包括 这 本 书 
中 将 出 现 的 各 种 定性 研究 的 成 有 末 ) 。 我 们 将 涉及 一 些 问 题 ， 比 如 这 个 研究 让 我 们 学 到 了 什么 ? 在 
什么 情况 下 你 才能 相信 这 些 研究 的 结论 ? 在 什么 情况 下 你 可 以 把 这 个 研究 的 结论 推广 应 用 到 更 
多 的 项 目 中 ? 为 了 解答 这 些 问 题 ， 我 们 可 以 参考 一 下 图 灵 奖 获得 者 Donald Knuth 于 1989 年 发 表 的 
文章 “TeX 的 错误 ” (The Errors of TeX ) [21 

在 这 篇 经 典 的 文 草 中 ，Knuth 分 析 了 他 在 编写 TeX 软 件 的 过 程 中 所 记录 下 的 超过 850 项 错误 。 
按 Knuth 的 说 法 ， 这 篇 文章 的 目的 是 “展示 在 TeX 的 开发 过 程 中 修复 过 的 错误 ， 并 尝试 分 析 这 些 
错误 。Knuth 前 述 他 使 用 这 个 方法 的 急 详 是 为 了 解决 量化 研究 的 一 些 局 限 : 

光 用 数字 是 无 法 表示 出 规模 的 概念 的 。 我 相信 一 个 详细 的 列表 可 以 给 我 们 很 多 重要 

的 启示， 而 这 些 局 示 是 无 法 通过 统计 数据 获得 的 。 

Knuth 的 发 现 是 什么 ? 他 从 一 个 大 型 的 错误 数据 库 中 整理 、 展 示 并 描述 了 15 种 错误 ， 还 分 别 
为 每 种 错误 附 上 了 例子 。 比 如 说 “粗心 和 失误 ”类 错误 ， 就 包括 了 语法 正确 但 是 语义 错误 的 程序 
语句 。 这 些 错 误 的 根本 原因 是 有 的 变量 名 字 的 概念 紧密 相关 , 但 是 却 会 导致 非 第 不同 的 程序 语义 
(比如 表示 前 、 后 变量 的 名 字 调 换 ， 或 者 比如 next line 和 new 1ize 等 )。Knuth 还 介绍 了 其 他 的 错误 
种 类 、TeX 项 目的 历史 、 他 写 TeX 时 的 一 些 经 历 以 及 他 记录 错误 的 方法 。 

在 文章 的 最 后 ， 他 总 结 道 : 

那么 我 到 放学 到 了 些 什么 ? 我 认为 主要 的 收获 是 我 的 平衡 感 和 比例 感 更 好 了 。 现 

在 ,我 明白 了 一 个 中 等 规模 的 软件 系统 的 复杂 性 之 所 在 ,以 及 这 个 系统 的 发 展 方 向 。 我 

也 ,明白 了 错误 的 种 类 是 如 此 繁多 , 所 以 我 们 无 法 用 系统 的 方法 来 去 除 一 切 可 能 “被 认为 

是 有 害 的 ”东西 。 我 还 明白 了 我 有 犯错 误 的 倾向 并 接受 现实 ， 然 后 当 我 犯错 的 时 候 可 以 

更 积极 地 承认 。 
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让 我 们 返回 上 一 步 ， 重 新 思 芳 一 下 这 篇 文 草 的 价值 : 作为 读者 ,我 们 又 学 到 了 些 什么 ?我 在 
20 世 纪 90 年 代 中 期 的 时 候 第 一 次 读 到 了 这 篇 文档 ,当时 我 学 到 了 很 多 : 我 从 来 设 有 编写 过 中 等 规 
模 的 软件 系统 , 而 文革 中 详细 的 背景 以 及 历史 信息 让 我 学 习 到 了 独立 开发 这 样 一 个 大 型 系统 的 经 
验 。 我 发 现 Knuth 介 绍 的 很 多 错误 类 型 在 我 目 己 编程 的 时 候 也 有 ， 不 过 也 发 现 了 很 多 不 曾 见 过 的 
问题 ， 这 些 都 让 我 可 以 更 好 地 思考 我 的 代码 出 问题 的 原因 。 作 为 一 个 研究 员 ， 我 还 从 这 篇 文章 中 
学 习 到 了 软件 开发 育 后 的 人 为 因素 ,， 即 : 我 们 如 何 思 芳 , 我们 的 记忆 是 如 何 工作 的 以 及 我 们 如 何 
做 计划 以 及 进行 推理 。 这 些 都 是 影 啊 软 件 质量 的 重要 因素 。 和 这 篇 文 草 类 似 的 还 有 一 些 ， 它们 把 
我 引领 到 了 一 条 研究 人 为 因素 的 职业 道路 上 , 让 我 可 以 通过 研究 更 好 的 编程 语言 、 工 具 以 及 六 程 
来 改善 软件 的 质量 。 

不 过 , 在 阅读 之 后 马上 就 学 到 东西 的 情况 并 不 多 见 。 我 也 古 在 读 完 之 后 的 儿 个 月 中 过 源 在 日 
己 的 工作 中 巧 识 到 Knuth 所 摘 述 的 错误 种 类 ， 而 除了 这 篇 文 草 之 外 ， 还 有 很 多 文章 和 都 ?| 起 了 我 的 
研究 兴趣 。 这 是 精细 地 解读 定性 研究 的 重 中 之 重 : 研究 的 推论 需要 时 间 才 能 体现 出 来 ， 而 且 你 还 
需要 坦诚 地 对 这 些 推论 进行 反思 。 如 来 你 仅仅 因为 蘑 个 毕 漏 或 者 你 不 认同 的 结论 就 把 整 篇 文革 都 
ER, 那么 你 可 能 会 错过 所 有 其 他 有 用 的 启示 , 而 想 要 得 到 这 些 局 示 你 必须 要 认真 而 持续 的 对 研 
FEN ZG ABET I. 

当然 ， 这 并 不 是 说 你 就 应 该 对 Knuth 的 结 末 全 盘 接 受 。 只 征 ， 你 不 应 该 感情 用 事 地 对 待 研究 
的 结 末 ， 而 应 该 用 更 加 系统 的 方式 来 进行 解读 。 一 般 来 说 我 主要 关注 赋 究 的 三 个 层面 : 输入 、 执 
行 和 输出 。( 听 起 来 就 像 软件 测试 ， 不 是 吗 ? ) 我 就 以 Knuth 的 研究 为 例 来 讨论 一 下 这 儿 个 层面 。 

首先 ， 你 信任 Knuth 的 研究 的 输入 吗 ” 比 如 说 ， 你 认为 TeX 是 一 个 典型 的 程序 吗 ? 你 认为 
Knuth 是 一 个 典型 的 程序 员 吗 ?你 信任 Knu 了 本 人 吗 ? 上 面 这 些 因 素 可 能 会 影响 你 对 人 研究 的 看 法 ， 
比如 : Knuth 的 15 种 分 类 起 人 否 全 面 ， 古 人 否 和 典型， 在 数 十 年 之 后 是否 仍然 会 在 工作 中 发 生 。 假 如 你 
认为 Knuth 无 法 代表 其 他 的 程序 员 ， 那 么 要 在 换 成 别人 来 做 这 个 研究 ， 结 有 会 有 怎样 的 不 同 呢 ? 
比如 说 ， 我 们 可 以 假设 Kouth 和 很 多 的 学 春 人 士 一 样 ， 征 个 心 不 在 达 的 教授 。 也 许 这 可 以 解释 为 
什么 有 那么 多 的 分 类 都 和 遗忘 什么 事情 或 者 缺乏 远见 有 关 了 【比如 分 类 包括 了 被 忘记 的 功能 、 模 
块 之 间 的 不 匹配 以 及 意料 之 外 的 情况 等 )。 也 许 一 个 更 加 上 自律 的 人 或 者 一 个 只 关注 代码 的 人 就 不 
会 有 那么 多 问题 。 这 些 干 扰 因 素 并 不 能 否定 研究 的 结 东 ,但 是 在 你 将 这 些 结 末 推广 应 用 之 前 ， 还 
征 应 该 仔细 考虑 它们 的 影 啊 。 

你 征 否 信任 Knuth 的 研究 的 执行 ? 换 句 话说 , Knuth 有 设 有 严格 按照 目 己 摘 述 的 方法 来 执行 实 
验 ， 以 及 如 条 他 没有 的 话 ， 这 些 偏差 又 会 对 研究 结 东 造 成 什么 影响 ” Knuth 使 用 了 日 记 研 究 法 ， 
这 种 方法 在 今天 常用 于 调查 人 在 长 时 间 内 的 经 历 和 感受 , 而 无 需 直 毛 对 其 进行 观察 。 要 想 用 好 日 
ERRE, 有 一 个 关键 点 就 古 不 能 告诉 参与 者 你 的 实验 想 要 找 出 什么 结 末 , 以 免 这 些 瞳 示 让 他 们 
产生 偏见 ， 影 响 了 他 们 写 什 么 和 如 何 写 。 但 古 在 这 份 钱 究 中 ，Knuth 既 是 研究 员 ， 又 古 参 与 者 。 
他 希望 能 得 到 什么 样 的 结 东 ? 起 不 是 在 写 日 记 之 前 他 在 脑海 中 就 已 经 分 好 了 类 ? 他 是 在 TeX 的 
开发 过 程 中 为 这 些 错误 分 类 ， 还 征 在 TeX 开 发 完成 后 来 回顾 分 类 的 ? Knuth 并 设 有 在 研究 报告 中 
介绍 这 些 细 市 ， 但 征 这 些 细 贡 却 可 能 大 大 地 改变 我 们 对 研究 结 采 的 解读 。 

日 记 人 研究 也 有 其 局 限 性 。 比 如 说 ,这 种 研究 有 可 能 会 造成 海 酚 堡 式 的 回 题 ， 即 观察 的 流程 可 
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能 会 唱 迫 写 日 记 的 人 不 断 地 对 记 下 来 的 问题 进行 反省 , 以 至 于 最 后 连 记 录 的 性 质 也 变 了 。 这 意味 
着 由 于 Knuth 一 直 在 记录 各 种 错误 ， 他 可 能 会 认真 地 思考 造成 这 些 错误 的 原因 ， 节 后 有 意识 地 如 
免 了 各 种 错误 ,最 后 就 无 法 观察 到 所 有 结案 。 此 外 ， 日 记 研 究 还 有 一 个 难题 ， 就 是 参 与 者 很 难 长 
时 间 地 坚持 。 比 如 说 ，Knuth 有 上 段 时 间 曾 暂停 了 他 的 实验 ,说道 :“ 我 没有 记录 下 在 Tex82 开 始 紧 
张 的 调试 工作 中 所 解决 的 错误 …… ”如 条 Knuth 在 那 段 时 间 做 了 记录 ， 他 会 发 现 什 么 样 的 错误 ? 
这 些 错 误 和 在 平时 压力 不 那么 大 ， 不 那么 紧张 的 时 期 发 现 鸭 错误 是 否 会 不 同 ? 

最 后 ， 你 是 人 否 信 任 这 项 研究 的 输出 及 其 推论 ? 学术 论 文 的 写作 标准 要 求 将 研究 结 来 和 推论 
区 分 开 来 ,以 方便 读者 确定 他 们 是 否 可 以 根据 同样 的 证 据 得 出 同样 的 结论 。 但 是 在 Knuth 的 文革 
中 , 他 从 头 到 尾 都 把 两 者 混在 了 一 起 , 不 但 详细 地 介绍 了 TeX 的 各 种 故障 ,也 提出 了 他 的 研究 推 
论 。 比 如 说 ， 在 描述 了 关于 意外 类 错误 〈(Knuth 说 这 些 是 全 局 误解 ) 的 各 种 有 趣 故 事 之 后 ， 他 这 
样 说 道 : 

这 段 经 历 告诉 我 们 , 所 有 的 软件 系统 都 应 该 经 历 你 能 想象 到 的 最 不 友善 最 难 对 付 的 
测试 的 磨炼 ,否则 ， 即 便 在 大 量 部 署 并 取得 较 好 的 反响 之 后 的 数 年 中 ,我 们 也 几乎 可 以 
肯定 系统 会 不 断 地 产生 bug。 


当 结 来 和 推论 并 排 在 一 起 的 时 候 , 读者 就 很 容易 扎 记 这 二 者 的 区 别 , 也 会 饼 记 应 该 将 它们 分 
开 来 分 析 。 我 相信 Knuth 对 于 这 些 (导致 了 上 述 推论 的 ) 故事 的 记忆 ， 因 为 他 描述 了 他 记录 这 些 
故事 的 流程 。 但 是 ， 我 认为 Knuth 过 度 解 读 了 这 些 故 事 的 意义 ,使 其 更 符合 他 的 结论 。 如 琳 Knuth 
化 了 如 此 多 的 时 间 在 痛 吉 测试 上 ， 他 还 有 可 能 完成 TeX 吗 ? 我 相信 他 的 日 记 ， 但 是 对 他 的 最 终 建 
议 ， 我 保留 怀疑 态度 。 

当然 , 我 们 有 必要 重申 一 操 ， 那 就 是 每 个 定性 研究 部 有 其 局 限 性 , 但 是 大 部 分 的 研究 都 能 给 
我 们 宇 贯 的 启示 。 作 为 一 个 定性 研究 的 客观 解读 者 ,我 们 必须 接受 这 个 现实 ,并 认真 地 辨别 这 两 
尽 。 好 的 研究 报告 会 帮 你 解决 这 个 同 题 ， 比 如 这 本 书 里 介绍 的 研究 。 


4.3 ”在 工作 中 运用 定性 研究 方法 


虽然 定性 研究 方法 通常 是 在 学 术 人 研究 中 使 用 , 但 是 这 些 方法 在 工作 中 也 有 很 大 的 作用 。 实 际 
上 ,， 当 你 需要 回答 任何 没有 标准 答案 的 问题 的 时 候 ， 这 些 方法 就 可 以 帮 上 和 仁 。 而 在 软件 工程 中 允 
到 的 问题 几乎 总 是 如 此 。 软 件 测 试 人 员 可 以 使 用 定性 研究 方法 来 解决 在 测试 中 遇 到 的 与 人 相关 的 
低 效 问题 ， 而 项 目 经 理 们 则 可 以 使 用 这 些 方法 来 研究 团队 的 社区 指标 会 如 何 影 啊 效 率 。 设 计 师 、 
开发 人 员 以 及 需求 工程 师 们 可 以 使 用 定性 研究 方法 来 更 深入 地 理解 他 们 的 用 户 , 以 便 更 好 地 满足 
用 户 的 需求 。 当 你 需要 分 析 谁 、 什 么 、 何 时 、 何 地 、 怎 么 做 以 及 为 什么 之 间 的 关系 的 时 候 ， 定 性 
研究 方法 就 可 以 帮 上 全。 

使 用 定性 研究 方法 就 和 当 个 名 侦探 或 者 记者 一 样 : 关键 站 要 发 现 事 实 真 相 ， 并 讲 一 个 令 人 信 
服 的 故事 一 一 但 同时 还 必须 意识 到 从 不 同 的 角度 会 看 到 不 同 的 事实 真相 。, 你 会 如 何 来 发 现 这 些 角 
度 在 很 大 程度 上 取决 于 研究 的 状况 。 你 需要 对 研究 所 处 的 社会 背景 有 所 领情, 这 样 你 才能 知道 谁 
可 以 信任 、 他 们 存在 哪些 偏见 以 及 他 们 鸭 哪 些 动机 可 能 会 影响 你 的 判断 。 只 有 上 其 备 了 这 些 认识 之 
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后 ， 你 才能 确定 如 何 结合 使 用 直接 观察 、 跟 踪 观 察 、 访 谈 、 文 档 分 析 、 日 记 研究 等 方法 。 

为 了 说 明 这 一 上 把， 我 们 不 妨 回 到 bug 跟 踊 系 统 的 例子 。 你 古 选 择 人 研究 方法 的 最 重要 的 因素 ， 
TEA RA A EIR EE |] el 

O 你 的 员工 是 否 喜欢 你 ? 

O fh le BAIR? 

O fie Oa EM? 

如 条 任何 一 个 问题 的 回答 是 “ 否 ” 的 话 ， 也 许 你 就 不 适合 做 这 个 研究 。 相 反 ， 你 可 能 需要 找 
到 一 个 更 加 公正 的 合作 伙伴 来 蔡 你 进行 这 个 研究 。 举 例 来 说 , 监察 员 就 是 非 笛 好 的 研究 人 员 的 候 
选 。 他 们 是 中 立 的 一 方 ， 但 是 他 们 又 必须 从 多 个 角度 看 得 问题 ， 这 样 才能 更 高 效 地 沟通 和 解决 问 
题 。 如 末 在 你 的 公司 中 有 监察 员 , 那么 他 们 将 是非 党 好 的 学 习 定 性 研究 方法 的 候选 研究 员 ,， 而且 还 
将 在 改善 工作 环境 的 过 程 中 扮演 重要 的 角色 。 

如 采 你 的 员工 确实 很 喜欢 你 ,那么 另 一 个 重要 的 因素 就 是 你 的 员工 。 他 们 能 人 否 很 好 地 进行 沟 
通 ? 他 们 是 否 诚实 ?” 他 们 是 否 喜欢 隐瞒 不 报 ? 你 的 团队 有 没有 分 派系 ?在 团队 中 有 没有 不 断 改 
善 的 传统 , SAMA ce GCM ASE? 这 些 都 是 确定 茶 种 研究 方法 是 否 可 行 的 社会 因素 。 举 例 
来 说 , 如 采 员 工 很 喜欢 隐瞒 不 报 , 那么 就 不 能 使 用 直接 观 罕 的 方法 , 因为 他 们 知道 自己 正 被 观察 。 
文档 分 析 可 能 会 有 用 , 但 古 你 的 团队 会 不 会 考虑 隐私 的 问题 ?访谈 只 有 在 访问 者 能 与 受 访 者 建 并 
融洽 关系 的 时 候 才 有 效 ,人 否则 就 得 不 到 任何 效 末 。 好 的 定性 研究 方法 的 目标 征 找到 一 种 观察 的 方 
法 ， 既 能 使 偏见 最 小 化 ， 叉 能 使 客观 性 最 大 化 。 

无 论 是 你 还 是 别人 来 做 这 个 研究 ， 还 有 一 个 重要 的 芳 量 束 是 你 如 何 来 加 团队 解释 这 些 研 究 。 
在 任何 情况 之 下 ， 秘密 进行 研究 ”的 想法 都 古 极 坏 的 。 你 提出 问题 的 原因 也 许 征 因为 你 想 解 决 
问题 ， 而 你 正 管 理 着 一 整个 团队 的 人 ， 他 们 都 可 以 解决 问题 …… 那 还 不 让 他 们 来 帮 愤 1 不 过 ,你 
必须 明确 告诉 他 们 ， 你 的 目标 是 了 解 他 们 ,不 是 命 令 他 们 。 你 还 应 该 表明 每 个 人 的 解释 不 同 很 正 
前 ， 因 为 每 个 人 的 角度 不 同 。 在 表明 了 这 些 之 后 ,团队 成 员 们 融会 明日 你 想 从 不 同 角度 来 看 问题 
的 愿望 ， 并 和 他 们 产生 共鸣 ， 这 样 他 们 就 更 容易 真诚 地 进行 反馈 。 

最 后 , 定性 研究 方法 有 时 候 会 让 人 感觉 松 敌 而 随 夸 。 你 怎么 能 相信 这 样 一 个 没有 结构 的 流程 
所 得 出 的 结 末 呢 ?” 问 题 的 关键 在 于 你 必须 认识 到 目 己 周围 的 偏见 并 接受 它 。 作 为 研究 员 的 你 有 偏 
见 ， 你 的 受 访 者 有 偏见 ， 而 你 所 使 用 的 各 种 研究 方法 也 都 偏 同 于 揭示 茶 种 现象 。 你 越 能 明确 地 识 
别 这 些 偏差 ， 越 了 解 它 们 会 如 何 有 影响 你 对 研究 结 来 的 解读 ， 你 的 研究 结 来 就 越 客 观 。 


4.4 推广 应 用 定性 研究 的 结果 


无 论 你 是 在 论文 中 看 到 定性 研究 的 结 东 还 是 你 目 己 做 的 研究 ,都 会 有 一 个 问题 ， 那 束 是 这 些 
结 抄 能 在 多 大 程度 上 被 推广 到 别处 ? 

比如 说 ， 定 性 研究 可 以 找 出 第 见 (common) 的 行为 ， 但 是 他 们 无 法 识别 普遍 (average) 的 
行为 。 普 志 〈 即 平均 ) 的 行为 以 及 其 他 汇总 统计 都 需要 计算 才能 得 出 ， 而 定性 研究 和 计算 无 关 。 
更 重要 的 是 ,由 于 收集 非 数 字 的 数据 需要 更 多 的 人 力 , 定性 研究 的 方法 通 第 只 能 得 到 较 小 的 样本 

















量 ， 这 样 想 要 推广 应 用 研究 的 结 朱 就 会 很 困难 。 

不 过 ,定性 研究 的 结 东 征 可 以 推广 应 用 的 。 比 如 说 ， 有 些 研究 可 以 证 明 在 一 个 环境 下 出 现 的 
因 东 关系 和 另 一 个 环境 下 的 因 末 关系 类 似 。 比 如 说 你 是 某 个 Web 程 序 的 UI 团 队 的 成 员 ,， 想 要 了 解 
为 什么 代码 审查 总 征 化 那么 长 的 时 间 。 虽 然 你 的 研究 结论 可 能 无 法 推广 到 管理 数据 库 后 台 的 团 
队 ， 但 是 却 可 能 推广 到 其 他 类 似 领 域 的 Web 程 序 的 前 站 团队 。 正 确 地 认识 在 什么 时 候 可 以 推广 研 
完结 未 和 定性 研究 本 映 一 样 困难 。 二 者 都 需要 依靠 主观 判断 来 确定 哪些 假设 在 新 的 环境 之 下 仍然 
有 效 。 


45 定性 研究 方法 是 系统 的 研究 方法 


在 软件 工程 的 研究 中 定性 研究 方法 的 使 用 越 来 越 多 , 而 对 于 软件 工程 实践 来 说 , 这些 方 法 也 
很 重要 。 但 是 人 简单 地 认识 问题 和 系统 地 认识 问题 有 着 很 大 的 区 别 。 所 以 ， 下 次 你 阅读 定性 研究 的 
结果 或 者 自己 进行 研究 的 时 候 ， 你 需要 确保 你 (或 者 你 的 文章 ) 遵循 下 面 这 样 的 流程 。 

e DUUUUUUD 

我 们 需要 了 解 什么 ”为 什么 ?我 们 能 拿 了 解 到 的 知识 来 做 什么 ? 

*HUUUUUUUUUU 

哪些 数据 可 以 客观 地 收集 , 以 尽量 地 减少 偏见 ?你 能 不 能 从 多 个 来 源 收 集 信息 ,以 解决 
单一 来 源 的 偏见 辣 题 ? 

e 00000000L 

X EEPE RRAZ Ale — BC, 还 是 相互 冲突 ?这 些 证 据 导 致 了 什么 新 问题 ?这 些 问题 

能 不 能 形成 一 个 新 的 假说 ， 并 用 更 多 数据 来 证 实 ? 


虽然 这 样 一 个 表达 问题 、 收 集 证 据 、 解 读 证 据 的 周期 可 能 会 很 长 ， 但 是 每 通过 一 轮 ， 你 都 将 
对 你 的 认识 更 有 信心 ， 这 也 意味 着 可 以 做 出 更 好 的 决策 ， 以 及 得 出 更 好 的 结案 。 此 外 ,结合 定性 
研究 方法 和 定量 研究 方法 ， 你 就 能 得 到 一 套 完 善 而 强大 的 研究 工具 ， 有 了 这 些 工具 的 帮助 ,你 将 
可 以 更 有 效 地 理解 和 改进 软件 工程 实践 。 
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实证 研究 ， 即使 用 广 为 认 可 并 且 经 过 验证 的 方法 以 证 明 某 种 断言 真实 性 的 正式 研究 方法 , E 
逐渐 在 软件 工程 中 取得 进展 。 令 人 欣慰 的 是 ， 人们 终于 承认 了 实证 研究 在 软件 工程 科学 中 的 重要 
地 位 。 我 们 也 在 科学 文献 中 看 到 越 来 越 多 的 实证 研究 和 相关 实验 ,它们 能 够 证 明 或 者 否定 茶 些 方 
法 、 技 术 和 工具 的 有 效 性 。 

但 可 惜 的 是 ,实证 研究 仍 未 补 用 于 新 的 探索 发 现 ， 只 是 在 概念 完善 后 饥 上 添 花 而 已 。 但 从 传 
统 上 来 说 ， 实 证 研究 这 种 科学 方法 是 指 运用 某 种 方法 、 技 术 或 工具 , 分 析 结 来 ， 从 而 改进 先前 的 
理念 。 也 就 是 人 们 一 直 以 来 检验 理论 并 对 它们 进行 改进 的 方法 。 在 软件 工程 中 ,各 种 理论 与 模型 
仍然 处 于 形成 阶段 ， 而 人 们 一 直 将 这 一 过 程 当做 创造 性 过 程 的 一 部 分 来 加 以 应 用 ,所 以 观察 实践 
以 及 进行 探索 性 研究 对 于 该 学 科 的 成 长 至 关 重 要 。 


5.1 软件 工程 研究 独 有 的 困难 之 处 


软件 工程 与 其 他 学 科 有 几 扣 不同 之 处 。 自 先 软 件 是 人 类 智力 与 创造 力 的 产物 , 而 不 是 机 械 地 
“制造 ”出 来 的 。 软 件 开发 的 流程 也 不 同 于 制造 的 流程 。 换 而 言 之 ， 软 件 流程 并 不 是 一 种 简单 的 
重复 放 动 。 这 征 该 学 科 不 同 于 其 他 学 科 的 关键 之 处 ， 也 极 大 地 彩 啊 了 我 们 对 它 的 解读 。 我 们 时 时 
刻 刻 都 需要 关注 环境 变量 所 市 来 的 影响 。 由 于 软件 工程 是 基于 “人 ”的 学 科 ， 所 以 研究 的 结 朱 总 
会 有 差异 , 我 们 也 无 法 控制 甚至 不 能 确认 所 有 的 环境 变量 。 所 以 在 探索 如 何 为 人 们 修改 和 调整 流 
程 的 过 程 中 ， 我 们 需要 不 断 进 行 实验 。 

环境 差异 并 不 单纯 指 软 件 开发 人 员 的 不 同 。 软件 的 每 一 部 分 都 不 尽 相 同 , 软件 开发 环境 亦 古 
如 此 。 这 也 就 意味 着 ,流程 是 变量 ,目标 是 变量 等 。 我 们 需要 为 所 研究 的 环境 选择 合适 的 目标 和 
合适 的 流程 。 所 以 ， 在 决定 如 何 饶 究 菜 种 技术 之 前 ， 我 们 需要 对 其 环境 和 特性 做 一 些 了 解 。 

软件 工程 的 第 二 点 与 众 不 同 之 处 在 于 软件 的 无 形 性 , 也 就 是 构架 、 组 件 、 开 发 形式 的 不 可 见 。 
这 一 点 和 软件 工程 的 第 三 个 特性 ， 即 该 领域 的 不 成 熟 性 密切 相关 ， 因 为 仍 没 有 完善 的 模型 能 帮助 
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我 们 推导 流程 、 产 品 和 它们 之 间 的 关系 。 这 些 困难 促使 以 下 两 种 需求 变 得 尤为 迫切 : 从 不 同情 境 
下 的 理念 应 用 中 学 习 ， 并 且 从 中 归纳 理论 或 者 模型 。 

最后 一 扩 在 于 ， 把 经 验 建 并 成 可 重用 的 模型 需要 额外 的 人 力 、 物 力 、 流 程 和 组 织 有 的 支持 。 建 
并 模型 、 进 行 度量 、 利 用 实验 找 出 最 有 效 的 技术 ,并 生成 反馈 信息 用 来 共同 学 习 部 需要 时 间 和 人 金 
钱 的 投入 。 这些 活动 并 不 是 软件 开发 的 副产品 。 如 末 没 有 独立 于 产品 开发 并 且 明 确 文 持 这 些 活动 
的 方法 ， 它 们 就 不 会 发 生 ， 我 们 也 就 无 法 从 根本 上 改进 开发 流程 。 

由 此 可 见 ， 成 功 的 实验 息 困 难 而 昂 贯 的 。 实 验 的 结 东 只 能 在 小 范围 内 确证 有 效 ， 而 受制 于 大 
规模 适用 性 、 研 究 方 法 整合 以 及 环境 变量 等 问题 。 


5.2 ”实证 研究 的 现实 之 路 


我 相信 我 们 有 必要 关注 非 正式 的 探索 性 研究 , 并 从 中 得 到 关于 软件 开发 的 指导 意见 。 在 适当 
的 时 候 , 将 这 些 意见 与 正式 的 实证 研究 相 结合 来 验证 我 们 的 理论 ,这些 理 论 会 加 入 整个 理论 体系 
并 了 最 终 使 软件 工程 更 加 明了 。 所 以 我 认为 软件 工程 学 科 的 研究 是 探索 并 逐步 进化 的 。 软 件 工 程 赋 
宛 导 循 科 学 方法 ， 但 由 于 其 特性 ， 真 实 实验 并 不 总 是 可 行 而 有 效 的 。 

在 我 看 来 ,软件 工程 研究 是 一 门 实验 室 科学 ， 而 且 和 是 一 门 内 容 广汉 的 大 学 科 。 实 验 室 的 规模 
之 大 , 使 得 我 们 必须 使 用 更 具 探 索性 的 方法 来 进行 研究 。 只 通过 分 析 是 无 法 理解 这 门 学 科 的 。 唯 
有 通过 在 软件 工程 的 实践 中 研究 各 种 关系 的 产生 和 变化 , 以 及 各 种 技术 的 限制 , 我 们 才能 知道 如 
PEE AC E Une CCK EP E o 

同时 我 们 需要 利用 一 切实 践 机 会 探索 各 种 理念 ， 比 如 对 可 行 性 进行 测试 ,看 看 人 们 征 否 可 以 
应 用 这 些 理念 , 理解 应 用 它们 所 需要 的 技术 , 并 测试 它们 与 其 他 概 你 的 相互 关系 。 基于 这 些 信息 ， 
我 们 可 以 调整 研究 环境 中 每 一 个 理念 ， 使 人 们 可 以 在 实践 中 轻松 使 用 。 其 至 在 建立 模型 之 前 , 我 
们 就 需要 在 实践 中 试用 我 们 的 理念 并 且 改 恨 它 们 。 简 而 言 之 我 们 从 事 的 是 探索 性 研究 ,我 们 比 很 
多 科学 虱 更 多 地 依赖 于 方法 和 技巧 的 实证 应 用 。 

多 样 性 是 我 们 在 软件 工程 中 运用 科学 方法 时 的 一 个 重要 方面 。 对 于 一 种 流程 , 我 们 需要 验证 
ETE AI ASE PAIZO, 才能 更 好 地 理解 流程 背后 的 理念 以 及 它们 之 间 的 相互 作用 。 随 着 时 间 
的 推移 , 我 们 还 需要 旁 上 让 所 有 的 环境 变量 。 如 来 没有 在 不 同 地 点 、 由 不 同人 对 流程 进行 应 用 的 话 ， 
很 多 环境 变量 的 影响 根本 无 法 体现 出 来 。 

仅 徘 一 个 团队 绝 不 足以 建立 这 样 的 理论 体系 。 作 为 一 门 庞大 的 科学 , 它 需 要 依靠 团队 之 间 的 
合作 。 了 研究 结 采 也 需要 被 高 效 地 共享 ， 比 如 可 以 建立 一 个 存放 不 断 完善 中 的 模型 以 及 经 验 教 训 的 
知识 库 ， 研 究 人 员 可 以 使 用 和 更 新 其 中 的 内 容 。 


5.3 NASA 软件 工程 实验 室 : 一 个 充满 活力 的 实证 研究 测试 平台 


为 了 支持 我 在 本 章 提 到 的 非 正 式 学 习 的 观点 , 我 将 总 结 我 们 在 NASA (National Aeronautics 
and Space Administration， 美 国 宇 航 局 ) 软件 工程 实验 室 (SEL) 25 年 的 经 验 。 在 SEL， 我 们 不 
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仅 通 过 实验 来 学 习 ， 而 且 通 过 分 析 问 题 、 应 用 可 行 的 解决 方法 、 并 找 出 其 不 足 之 处 来 不 断 学 
习 经 验 。 我 们 也 进行 了 对 照 实验 与 案例 人 研究， 但 是 古 在 一 个 不 断 改进 的 更 大 型 的 学 习 流 程 中 
执行 的 。 

SEL 建 并 于 1976 年 , 冒 在 为 卫星 系统 的 软件 开发 提供 地 面 支持 , 并 且 在 可 能 的 情况 下 用 观察 、 
实验 、 学 习 和 建立 模型 的 方法 为 位 于 Goddard” 的 飞行 动力 学 部 门 优 化 流程 和 提高 产品 质量 “。 实 
验 室 的 研究 团队 由 NASA 与 CSC 电 脑 科技 集团 (CSC) 的 开发 人 员 ， 以 及 马里 兰 大 学 的 一 个 研究 
团队 组 成 ， 三 者 组 成 了 一 个 联盟 。SEL 决 定 支 持 我 们 的 实证 人 赋 究 ， 并 且 将 其 并 入 组 织 的 束 体 工作 
中 。 实 验 支 出 来 自 项 目 自 身 的 经 费 ， 而 非 来 日 NASA 的 研究 经 费 。 

在 1976 年 ， 几 乎 没有 关于 软件 工程 的 实证 研究 , 而 建立 一 个 研究 软件 开发 的 实验 室 更 是 前 所 
未 有 的 。 该 实验 室 的 建立 提供 了 一 个 民 好 的 学 习 环 境 , 在 实验 室 中 ， 人 们 设计 并 运用 次 在 的 解决 
方案 、 检 验 其 有 效 性 、 从 中 总 结 经 验 ， 从 而 优化 解决 方案 。 实 验 室 话 动 只 限于 一 个 特定 领域 ， 由 
专业 的 开发 人 员 参 与 , 同时 得 到 当地 机 构 的 鼎力 支持 。 人 研究 团队 与 实际 开发 人 员 紧 密 交 流 ， 这 是 
一 个 开发 人 员 和 管理 人 员 组 成 的 团队 ,他 们 性 格 各 异 , 拥有 不 同 的 职 贡 和 目标 。 以 上 这 些 特 质 使 
其 成 为 进行 实证 研究 的 沃土 。 实验 室 各 方面 的 平衡 创造 了 一 个 理想 的 学 习 环 境 , 大 家 通过 彼此 合 
作 及 反馈 可 以 相互 学 习 。 

从 1976 年 到 2001 年 ， 我 们 在 不 断 犯错 中 学 到 了 很 多 。 所 犯 下 的 错误 包括 : 

O 在 全 面 认 识 环 境 之 前 就 妄 下 断言 ; 

O 走 数 据 主 寻 ， 而 非 目 标 主导 或 是 模型 主妇 ; 

口 用 其 他 环境 下 得 出 的 模型 解释 我 们 的 环境 。 

学 习 的 进化 疲 程 是 独 进 的 而 非 跃进 的 。 利 用 每 次 学 习 的 经 历 ,我 们 试图 把 学 习 到 的 知识 运用 
到 流程 模型 ， 产 品 与 组 织 机 构 上 。 

SEL 请 大 学 研究 人 员 验 证 高 风险 的 方案 。 我 们 建立 模型 并 测试 假设 。 同 时 我 们 开发 技术 、 模 
型 和 理论 来 解决 问题 ， 从 而 了 解 哪些 方案 是 有 用 的 。 我 们 在 应 用 中 借鉴 他 人 的 方案 ， 也 人 研究 出 一 
些 目 己 的 方案 。 实 验 室 的 研究 就 是 如 此 进行 的 。 

我 们 重要 的 发 现 是 如 何 把 科学 方法 运用 于 软件 领域 ， 即 如 何 从 概念 运用 、 人 案例 研究 、 以 及 对 
照 实 验 的 反馈 信息 中 得 到 局 发 从 而 改进 特定 环境 中 的 软件 开发 流程 。 非 正式 的 反馈 指导 我 们 应 该 
关注 案例 研究 与 实验 中 的 哪些 部 分 ,同时 我 们 也 出 乎 意料 地 从 非 正 式 的 反馈 中 得 到 了 关键 的 启发 。 

本 革 回 顾 了 我 们 实际 运用 科学 方法 的 实践 流程 , 以 及 我 们 古 如 何 基于 实践 中 得 到 的 反馈 而 改 
进 方法 的 。 


5.4 质量 改进 沁 陈 


我 将 从 最 精华 的 部 分 说 起 , 即 在 商业 环境 下 把 科学 方法 运用 于 软件 工程 的 过 程 。 我 们 把 这 种 
科学 方法 称 为 质量 改进 范式 (QIP) 一 。 它 一 共 分 成 6 个 基本 步 又。 











O Goddard 空 间 飞 行 器 中 心 ， NASA 主 要 的 空间 研究 实验 室 之 一 ， 位 于 美国 马里 兰州 。 一 一 译 者 注 
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(1) 使 用 适当 的 模型 和 指标 表征 手头 的 项 目 与 环境 。( 我 们 的 世界 是 什么 样子 的 ?) 

(2) 为 项 目的 成 功 与 进步 设 定量 化 的 目标 。 (对 于 世界 我 们 想 知 道 些 什么 ,我 们 要 达成 什么 
目标 ? ) 

(3) 为 该 项 目 选 择 流程 模型 ， 以 及 支持 该 流程 模型 的 方法 与 工具 。( 在 这 样 的 环境 下 ， 需 要 运 
用 怎样 的 流程 来 实现 目标 ? ) 

(4) 执行 流程 ， 搭 建 产 品 ， 搜 集 、 验 证 、 分 析 数 据 为 修正 提供 实时 反馈 。( 执 行 选 定 的 流程 时 
发 生 了 些 什么 ?) 

(5) 分 析 数 据 以 评估 现状 、 确 定 问题 、 记 录 发 现 、 为 将 来 的 项 目 做 出 改进 意见 。( 所 采纳 的 方 
案 表 现 如 何 ? 缺少 了 什么 ? 如 何 解决 ? ) 

(6) 封装 得 到 的 经 验 用 来 改进 模型 ， 把 当前 项 目 与 以 往 项 目 中 得 到 的 知识 结构 化 ， 存 人 经 验 
库 中 以 便 重 用 。( 如 何 把 经 验 为 机 构 所 使 用 ? ) 

质量 改进 范式 (QP) 是 一 个 双 循 环 的 流程 ， 如 图 $-1 所 示 。 研 究 与 实践 进行 交互 ， 二 者 分 别 
由 理念 应 用 中 所 得 到 的 项 目 经 验 和 共同 经 验 所 代表 。 


共同 学 习 





图 5-1 质量 改进 范式 
然而 QIP 并 非 一 开始 就 是 如 些 。 随 着 对 执行 流程 的 观察 ,我们 久而久之 用 所 得 到 的 知识 改进 
了 每 个 步骤 之 后 最 终 形成 了 这 个 方法 。 之 后 我 将 会 讨论 步骤 的 改进 以 及 得 到 的 局 发 ， 在 这 里 ， 正 


式 实 验 对 主要 理念 的 证 明 只 起 到 文 持 的 作用 。 
整个 学 习 流 程 跨越 25 个 年 头 ,， 本章 中 我 将 集中 介绍 前 20 年 的 研究 所 得 。 虽 然 它 们 之 间 存 在 角 
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色 重 登 ,我 的 讨论 将 履 盖 QIP 中 的 6 个 步骤 。 对 于 每 一 个 案例 ,我 会 介绍 我 们 在 应 用 科学 方法 时 得 
到 的 经 难 教 训 ， 以 及 我 们 在 NASA/GSFC 的 飞行 动力 学 部 门 中 改进 软件 开发 时 得 到 的 经 验 。 

从 1976 年 起 ， 我 们 进行 了 如 下 一 些 活动 ,对 应 于 质量 改进 邯 式 的 6 个 步骤 : 表征 、 设 立 目 标 、 
verre. WITE. AAT. BR. 





5.4.1 表征 


起 初 ， 我 们 试图 使 用 已 经 存在 的 一 些 模 型 来 帮助 我 们 理解 环境 (比如 雷 利 波 曲 线 或 是 MTTF 
模型 )。 结 来 我 们 发 现 它们 并 不 合适 ， 要 么 因为 它们 的 定义 是 服务 于 相对 更 大 型 的 项 目 (以 
100KLOC 为 单位 )， 要 么 就 是 使 用 它们 的 时 间 点 并 不 符合 我 们 的 需要 。 所 以 我 们 开始 用 目 己 的 数 
据 设 计 适 合 于 自身 环 境 的 模型 。 我 们 需要 更 好 地 理解 和 表征 环境 、 项 目 、 流 程 等 ， 因 为 我 们 无 法 
使 用 别人 从 其 他 环境 中 提取 的 模型 

我 们 必须 了 解 我 们 的 问题 区 域 。 久 而 和 久之， 我 们 开始 建立 基线 来 帮助 我 们 了 解 局 部 环境 。 在 
图 5-2 中 ， 每 一 个 框 表 示 对 应 茶 一 个 卫星 的 地 面 文 持 软件 。 我 们 为 此 建立 了 成 本 的 基线 、 缺 陷 的 
基线 、 重 用 百分比 的 基线 、 缺 陷 类 型 的 基线 、 工 作 量 分 布 的 基线 、 代 码 库 中 代码 增长 的 基线 等 ， 
并 用 这 些 基线 信息 定义 目标 ， 形 成 历史 数据 做 为 比 对 的 基础 。 

在 不 断 改 进 的 流程 中 ,我们 发 现 需 要 更 好 地 理解 那些 使 得 项 目 相 同 或 者 不 同 的 因素 , 这 样 可 
以 帮助 我 们 选择 更 适合 的 模型 ,并且 知 道 哪 些 变 量 影响 了 项 目的 效率 。 背 景 信息 ， 其 至 古 局 部 坏 
觉 之 内 的 也 古 十 分 重要 的 。 




















5.4.2 设立 目标 


从 一 开始 我 们 就 决定 使 用 度量 作为 抽象 化 方法 以 使 发 生 的 行为 清晰 可 见 , 并 且 建 立 数据 采集 
表格 与 度量 工具 。 我 们 搜集 了 6 个 项 目的 数据 并 存 和 人 一 个 小 型 数据 库 ， 并 试图 解释 这 些 数据 ， 结 
打发 现 有 些 时 候 疫 有 正确 的 数据 或 是 充足 的 信息 来 回答 我 们 的 问题 。 所 以 我 们 意识 到 不 能 单纯 地 
搜集 数据 然后 再 计划 如 何 处 理 它们 ; 数据 的 采集 必须 是 以 目标 为 导向 的 。 这 促使 我 们 编号 了 目标 
问题 矩阵 方法 (GQM)， 用 它 指导 对 一 个 特定 研究 的 数据 采集 工作 “。 但 这 样 仍然 可 能 会 引入 过 
多 的 数据 ， 特 别 是 没有 目标 的 时 候 。 我 们 不 断 地 改进 GQM， 比 如 定义 目标 模板 “。 

我 们 还 认识 到 使 用 基数 定量 与 序数 标量 可 以 在 结 研 究 末 中 捕捉 到 其 他 方式 难以 得 到 的 信息 。 
随 着 模型 的 发 展 ,根据 该 环境 中 超过 100 个 项 目的 经 验 , 我 们 把 数据 库 也 换 成 了 基于 模型 的 经 验 库 。 

















5.4.3 选择 流程 


我 们 自 先 探索 性 地 重组 了 现 有 的 流程 , 尽 可 能 降低 对 流程 的 有 影 啊 。 然 后 我 们 开始 在 大 学 中 与 
学 生 一 起 做 对 照 试验 ， 以 便 用 最 小 成 本 区 分 出 某 几 个 变量 的 影响 ”。 在 理解 了 这 些 流程 的 效果 之 
后 , 我 们 就 开始 用 成 熟 且 具有 影 啊 力 的 技术 集 来 进行 实验 。 很 多 此 类 技术 都 先 在 大 学 的 对 照 试验 
中 被 研究 过 , 然后 由 SEL 用 于 实际 的 项 目 中 ,比如 逐步 抽象 的 代码 阅读 法 (Coding Reading Stepwise 
Abstraction) 中 净 室 方法 (Cleanroom) 以及 面向 Ada 与 对 象 设计 方法 (Ada and Object oriented 
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design) “ 。 大 学 研究 减 小 了 SEL 使 用 这 些 技术 的 风险 。 随 着 时 间 的 推移 ， 我 们 了 解 了 如 何 组 合 
对 照 试 验 与 案例 研究 ， 以 便 对 独立 活动 进行 正规 的 分 析 。 
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图 5-2 ” NASA 的 基线 示例 


54 质量 改进 范式 53 





我 们 首先 对 新 技术 进行 实验 , 以 研究 流程 应 用 与 相应 产品 特征 之 间 的 关系 。 这 些 技术 的 选择 
古 基 于 我 们 在 SEL 中 观察 到 的 各 类 问题 ， 同 时 以 特定 的 目标 为 对 象 ， 比 如 最 小 化 缺陷 。 为 了 识别 
需求 中 的 问题 ， 我 们 开发 了 一 系列 阅读 技巧 ， 以 便 从 需求 文档 中 发 现 缺陷 “。 

我 们 清楚 地 意识 到 选择 正确 的 流程 对 于 建 并 符合 预期 的 产品 特性 的 重要 性 , 并 且 某 种 形式 的 
评 鸽 与 反馈 对 于 项 目 控制 来 说 很 有 必要 ,重用 流程 ,产品 以 及 其 他 形式 知识 的 经 验 是 改进 的 关键 。 
随 着 经 验 的 增长 ， 我 们 也 学 习 了 适应 与 改进 技术 。 





5.4.4 执行 流程 


执行 流程 开始 时 , 采集 数据 成 了 一 项 额外 工作 。 我 们 希望 开发 人 员 在 正常 进行 开发 流程 的 同 
时 , 填写 我 们 的 数据 表 。 我 们 随意 地 监测 了 一 下 这 个 流程 , 以 确保 开发 人 员 理 解 并 填写 了 数据 表 。 
终 咽 应 用 一 致 性 和 文 持 工具 的 缺乏 迫使 我 们 不 得 不 手动 采集 数据 。 我 们 与 开发 人 员 分 享 中 间 结 
A, 以便 他 们 提出 反馈 ,修正 错误 的 理解 ， 并且 提出 更 好 的 方法 采集 数据 。 随 着 时 间 的 推移 ， 我 
们 使 用 GQM 和 手动 采集 的 数据 越 来 越 少 ， 我 们 把 数据 采集 直接 租 入 到 开发 流程 中 ， 这 样 数据 更 加 
准确 ， 开 销 更 少 ， 并 且 使 我 们 能 够 评估 流程 的 一 臻 性。 通过 开发 人 员 与 实验 工作 人 员 的 互动 , 我 
们 獒 取 了 开发 人 员 经 验 的 详细 信息 ， 为 局 部 需求 和 目标 提供 有 效 反 馈 。 然 后 ， 通 过 普遍 的 信息 反 
馈 流 程 合并 对 照 试 验 与 案例 研究 ， 对 特定 方法 技术 提供 更 正规 的 分 析 。 





5.4.5 分 析 


为 了 表征 环境 ,我 们 首先 要 建立 分 析 基 线 。 基 线 由 很 多 变量 组 成 ,其 中 包括 工作 内 容 、 缺 陷 
类 型 ， 其 至 是 随 着 时 间 的 代码 增长 。 这 些 变 量 癌 我 们 提供 关于 环境 的 见解 ， 局 发 我 们 应 该 着 重 改 
进 哪些 方面 ， 并 且 让 我 们 更 好 地 理解 项 目 之 间 的 相同 与 不 同 之 处 。 我 们 使 用 实验 旋 式 来 分 析 软 件 
开发 研究 ， 即 实验 的 设计 、 评 估 、 反 馈 对 于 学 习 都 至 关 重 要 。 分析 方 法 的 变迁 从 分 析 变 量 间 联系 
开始 ,到 建立 回归 模型 “和 更 加 复杂 的 量化 方法 “， 最 后 到 包含 各 种 形式 的 定性 分 析 方 法 ”。 在 
学 习 流 程 中 ,定性 分 析 十 分 重要 ,使 我 们 认识 到 各 种 现象 的 起 因 。 我 们 一 步 一 步 应 用 从 观察 与 反 
馈 中 产生 的 想法 来 改进 我 们 的 理解 ,同时 把 它们 融入 模型 当中 , 指导 我 们 应 该 在 何 时 何 处 使 用 更 
加 正规 的 分 析 方 法 。 

我 们 也 意识 到 执行 一 个 涵盖 所 有 环境 变量 的 大 规模 有 效 实 验 是 不 可 能 的 。 所 以 从 预先 实验 的 
设计 和 准 实验 中 得 到 的 局 发 十 分 关键 ， 并 且 我 们 把 它们 与 对 照 试验 结 采 、 娄 例 研 究 结合 在 一 起 。 

















5.4.6 封装 


我 们 对 于 封 次 实验 结 来 的 微妙 性 、 重 要 性 与 复杂 度 的 理解 发 展 得 很 缓慢 。 我 们 在 一 开始 记录 
了 基线 与 模型 。 然 后 ， 我 们 认识 到 目标 明确 的 、 可 修改 的 技术 包 的 重要 性 ， 比 如 通用 代码 组 件 或 
者 可 针对 具体 项 目 修改 的 技术 。 我 们 的 实验 结 采 需要 在 环境 中 使 用 ， 并 且 需 要 不 断 地 根据 我 们 的 
经 验 改 变 环 境 。 技 术 转 移 包 括 一 个 新 的 组 织 构架 、 实 验 和 循序 靖 进 的 文化 改变 。 我 们 建立 起 0 DU 
OO ， 即 在 特定 机 构 中 基于 观察 和 反 乌 的 行为 模型 。 我 们 为 流程 、 产 品 、 缺 陷 和 质量 建立 专门 的 
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可 修改 的 模型 ， 用 各 种 方式 封装 我 们 的 经 验 (例如 方程 、 直 方 图 和 参数 化 流程 定义 )。 难 点 在 于 合 
并 这 些 封装 好 的 经 验 ， 所 以 诞生 了 经 验 工厂 组 织 (Experience Factory Organization) H, 参见 图 5-3。 


项 目 组 织 经 验 工厂 
环境 特征 





1. 表征 环境 
2. 设 定 目标 项 目 支持 
3. 选择 流程 可 改进 的 知识 


咨询 


产品 , 教训 ， 
执行 计划 
经 验 基础 标准 化 


传播 


流程 修改 


4. 执行 流程 
数据 ， 教 训 


图 5-3 经验 工厂 组 织 


经 验 工厂 的 流程 、 产 品 和 其 他 形式 的 知识 对 于 改进 十 分 重要 中 。 并 让 人 认识 到 从 组 织 内 部 
取 的 经 验 和 获得 的 知识 需要 和 项 目 开 发 组 织 拆 分 开 来 。 典 型 的 项 目 组 织 话 动 把 一 个 问题 分 成 简单 
的 几 份 ， 解 决 方法 的 实施 ， 设 计 与 实现 ， 验 证 与 确认 。 有 目标 是 在 成 本 之 内 按时 完成 项 目 。 经 验 工 
厂 的 活动 包括 统一 不 同 的 解决 方案 ， 重新 定义 问题 ,一般 化 、 形 式 化 和 整合 经 验 。 通 过 综合 分 析 
观 罕 结 果 ， 用 实验 测试 各 种 意见 来 完成 。 其 日 标 是 获取 经 验 并 为 项 目 提 供 推荐 意见 。 它 的 主要 贡 
任 是 评 佑 、 修 改 、 封 装 经 验 以 备 重用 。 

经 验 工 厂 不 能 单纯 基于 小 型 的 、 已 验证 的 实验 。 人 们 需要 观 罕 实际 应 用 中 的 意见 、 概 念 、 流 
程 等 ， 从 中 得 到 局 发 ， 加 之 理性 的 判断 ， 以 此 为 基础 建立 经 验 工厂 。 

只 有 当 我 们 知道 如 何 从 观察 中 学 习 , 并 且 结 合 案 例 研 究 与 对 照 试验 的 结果 (实验 结果 比 我 们 
的 看 法 更 容易 发 表 )， 我 们 才能 继续 应 用 、 观 察 、 学 习 这 一 流程 。 我 们 也 触及 到 现成 构件 开发 
(Commercial Off-The-Shelf ，COTS ) 、 了 阅读 技 巧 等 。 

在 一 个 组 织 中 的 学 习 过 程 是 耗费 时 间 且 循序 渐进 的 ,为 了 让 我 们 的 开发 团队 保持 兴趣 ， 我们 
需要 提供 一 些 短 期 的 结果 。 我 们 需要 找到 途径 加 速 学 习 的 过 程 ， 得 到 中 间 结 果 ， 更 快 地 反馈 到 项 
日 中 。 如 果 我 们 的 演进 过 程 是 成 功 ， 那么 基线 与 环境 也 会 一 直 变 化 ， 所 以 需要 不 断 地 重新 分 析 环 
党 。 我 们 需要 谨慎 地 在 优化 与 复 用 经 验 之 间 做 取舍 。 
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5.5 结论 


本 革 中 讲述 了 我 们 在 超过 25 年 的 时 间 里 的 演变 并 针对 特定 环境 定制 目标 和 流程 的 过 程 。 我 们 
在 三 个 时 间 点 上 “(1987，1991 和 1995) 使 用 三 个 数据 来 衡量 持续 改进 的 效 末 : 开发 缺陷 率 、 减 少 
的 开发 成 本 以 及 代码 重用 的 改进 。 每 一 个 数据 表示 每 个 年 份 前 三 年 间 的 平均 数 ， 参 阅 表 5-1。 


表 5-1 在 SEL 中 应 用 QIP 的 结果 





SEL 中 的 不 断 改 进 流程 1987 年 一 1991 年 1991 年 一 1995 年 
开发 缺陷 率 75% 37% 
减少 的 成 本 55% 42% 
代码 重用 改善 300% 8% 


在 这 段 时 间 内 ， 在 建 系统 的 功能 不 断 增 加 。 据 一 个 独立 研究 的 结 东 显示 ， 从 1976 年 至 1992 
年 ， 功 能 增加 了 5 倍 。 

该 研究 耗费 了 10% 的 开发 经 费 ， 但 这 10% 经 费 币 来 的 改进 却 显 示 出 一 个 数量 级 的 改进 ， 投 资 
回报 率 很 高 。 

但 表 5-1 中 的 数据 并 不 古 一 个 对 照 试 验 其 至 民 好 定义 的 娄 例 研究 的 结 末 。 即 使 我 们 什么 也 没 
有 做 ， 它 们 也 许 也 会 发 生 。 因 为 没有 对 照 组 。 但 我 们 有 不 同 有 看 法 ,我 们 相信 这 是 学 习 流 程 的 结 
东 。 在 我 们 不 知道 从 何 时 开始 ， 将 要 做 什么 ， 又 会 如 何 发 展 的 情况 下 ,不 可 能 对 这 项 25 年 的 研究 
进行 对 照 试 验 。 

在 SEL 的 25 年 中 ， 我 们 对 软件 改进 有 了 深刻 的 了 解 。 我 们 的 学 习 流 程 也 和 软件 开发 改进 本 入 
一 样 ， 不断 改进 。 我 们 把 所 学 到 的 应 用 到 流程 ， 产 品 以 及 组 织 构 淋 中 。 洲 变 流程 依赖 于 研究 与 实 
践 的 共生 关系 。 这 种 关系 需要 双方 面 的 耐心 和 理解 ， 但 是 一 旦 成 熟 ， 就 会 市 来 收益 。 

我 们 在 应 用 中 学 习 ， 并 适当 地 配合 了 各 种 预先 实验 设计 ， 准 实验 ,对照 试验 和 熔 例 研究 ， 并 
得 出 了 丰富 的 实践 及 理论 结 末 ,这样 的 结 来 古 无 法 从 单纯 的 正式 试验 中 得 到 的 。 此 外 ,这 种 大 规 
模 学 习 流 程 还 促成 了 诸如 GQM、QIP 和 经 验 工 厂 等 多 种 技术 和 方法 的 评估 和 发 展 。 
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性 格 、 智 力 和 专业 技能 
对 软件 开发 的 影 啊 


Jo E. Hannay 


软件 工作 中 最 重要 的 因素 不 是 程序 员 所 使 用 的 工具 和 技术 ,而 是 他 们 的 自身 素质 。 6 
Robert Glass (Fact 1 of Facts and Fallacies of Software Engineering [2002]) 


按照 “个 体 差异 ” 研 儿 ,优秀 的 程序 员 比 普通 程序 员 要 好 上 28 倍 。 考 虑 到 他 们 的 薪 
副 从 来 不 是 与 之 相称 的 ， 所 以 他 们 是 软件 领域 最 合算 的 买卖 。 
Robert Glass (Fact 2 of Facts and Fallacies of Software Engineering [2002]) 


Robert Glass 的 两 个 假说 刊登 于 IEEE 计 算 机 学 会 网 站 的 一 篇 名 为 “软件 工程 中 被 遗忘 的 基本 
第 见 行 为 ”的 文中 。 这 两 个 假说 反映 了 几 个 重要 问题 。 最 首要 的 是 ， 他 们 把 焦点 放 在 计算 编程 中 
“人 的 问题 ”上 而 不 是 其 他 技术 方面 。 这 种 聚焦 帮助 了 实证 软件 工程 的 研究 学 科 ， 使 它 从 其 他 角 
RE (管理 学 、 社 会 学 和 心理 学 ) 来 讨论 软件 工程 实践 。 有 人 会 说 ， 为 了 使 软件 工程 实践 更 加 以 证 
据 为 基础 ， 这 样 做 是 必要 的 。 

为 便于 讨论 ， 我 们 假设 Robert Glass 的 两 个 假说 成 立 。 请 注意 ， 不 断 重新 评估 和 完善 这 种 言论 
已 经 是 我 们 的 一 项 工作 ， 即 使 它们 可 能 是 基于 实证 的 。 知 识 永 远 不 会 是 静态 的 ， 因 此 Glass 的 观点 
可 能 需要 做 一 些 改进 。 但 是 ， 先 把 这 个 问题 放 一 放 。 我 们 现在 感 兴趣 的 是 其 所 引发 的 三 个 问题 ,， 它 
们 同时 也 上 自 成 一 体 。 这 些 癌 题 把 软件 开发 作为 一 个 整体 ， 而 不 只 有 编程 ， 因 此 更 具有 普遍 意义 。 

O 你 能 确切 定义 出 优秀 的 软件 开发 者 吗 ? 

O 如 果 可 以 ， 你 能 否 找到 可 靠 并 有 效 的 方式 确定 一 名 开发 人 员 比 其 他 人 更 优秀 ? 

O 如 果 你 不 能 ， 你 是 否 应 该 更 专注 于 工具 和 技术 ? 

如 果 能 确定 地 回答 前 两 个 问题 ， 其 意义 不 亚 于 一 场 小 革命 ,Joel Spolsky 这 样 的 人 会 很 高 兴 。 
他 曾 写 道 ， 聘 请 巨星 程序 员 (而 韭 普通 程序 员 ) 将 决定 你 是 创造 出 一 个 能 够 推进 世界 前 进 的 真正 



































O 世界 最 具 影 啊 力 的 程序 员 网 志 Joel on Software 的 主人 ， 当 今 最 热门 技术 网 站 Stack Overflow 创 办 人 。 其 作品 《软件 
随想 录 》 已 由 人 民 邮 电 出 版 社 出 版 。 一 一 编者 注 
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伟大 的 产品 ,还 古 只 产 出 平庸 的 代码 , 使 团队 中 的 其 他 人 陷于 不 断 的 重新 设计 、 重 新 构架 和 调试 
的 痛苦 中 “。 然而 , 事实 是 很 难 找到 顶尖 程序 员 。 长 期 从 事 招 聘 软 件 专业 人 员 的 人 对 于 如 何 发 现 
高 端 程序 员 有 一 些 合理 的 意见 和 有 用 的 建议 (参见 Spolsky 的 文章 )， 但 问题 依然 严峻 。 通 常 ， 如 
何 寻找 、 留 住 、 发 展 人 才 是 人 力 资源 经 理 们 的 首要 问题 ， 但 2010 年 全 球 评估 趋势 报告 ”显示 , 依 
然 缺 乏 一 套 以 证 据 为 基础 的 方法 来 解决 这 些 问 题 。 

第 三 个 问题 和 涉及 关注 个 人 能 力 ( 例 如， 技能 和 个 性 ) 与 关注 辅助 环境 (例如 ， 使 用 工具 或 者 
结对 编程 ) 的 区 别 。 殿 用 最 好 的 程序 员 古 不 够 的 ， 正如 航空 公司 聘请 最 好 的 飞行 员 也 不 足以 减少 
空难 发 生 的 风险 ， 还 必须 在 环境 中 加 入 许多 安全 特性 ， 并 且 需 要 与 人 合作 的 能 

在 人 的 专业 技能 与 工具 之 间谍 求 最 佳 平 衡 并 非 多 事 。 但 如 采 不 能 定义 专家 , 那么 你 可 能 没有 机 
会 来 平衡 任何 东西 。 此 外 , 如 采 你 目 认 为 知道 怎样 的 人 征 优秀 的 程序 员 , 但 你 的 直觉 却 征 错误 的 话 ， 
那么 你 的 项 目 处 境 可 能 会 很 悲惨 , 除非 有 环境 措施 能 够 发 现 问题 , 并 能 对 不 可 预见 的 紧急 情况 进行 
调整 。 于 是 Glass 观 点 的 可 操作 性 依赖 于 能 够 可 靠 地 从 人 人 群 中 找 出 聪明 人 。 正 如 我 们 将 要 看 到 的 ， 
这 不 容易 做 到 。 软 件 工 程 涵 盖 各 种 任务 ， 当 前 任务 的 性 质 影 响 了 人 们 对 专业 技能 的 判断 能 力 。 

让 我 们 从 编程 开始 说 起 。 


6.1 ”如 何 辨 列 优秀 的 程 友 员 


我 们 需要 考虑 两 个 更 深层 次 的 问题 来 确定 征 人 否 能 够 定义 优秀 的 程序 员 。 
O 程序 员 里 上 的 哪些 因素 使 其 有 优秀 的 编程 表现 ? 是 否 因为 她 的 经 验 ? 或 者 是 她 的 个 性 ? 
又 征 否 需要 测量 她 的 智商 ?结对 编程 和 团队 工作 时 ， 这 些 问 题 的 答案 又 如 何 ” 
O 什么 十 优秀 的 编程 表现 ?” 例 如， 你 应 该 屡 用 单位 时 间 写 代码 最 多 的 人 还 是 不 管 所 耗 时 间 ， 
代码 质量 最 高 的 人 (无论 质 量 是 如 何 定 义 的 )? 
这 些 问 题 触及 了 最 基础 和 最 困难 的 部 分 。 工 作 中 , 当 人 们 需要 做 出 战略 决策 时 ,这 些 问题 都 或 
明 或 暗 地 由 直 筑 决定 ,或 者 根据 多 少 有 些 关 不 住 脚 的 个 人 档案 和 能 力 测 斌 决定。 在 学 术 研 究 中 , 这 
些 问题 有 着 更 深入 和 更 广泛 的 意义 ,于 十 催生 出 大 量 跨越 学 科 的 研究 工作 ,试图 深入 理解 这 些 问 题 。 


6.1.1 MAF: 固定 的 还 是 可 塑造 的 


把 人 与 人 区 别 开 来 的 各 种 特征 , 研究 人 员 简 称 之 为 个 体 差异, 可 以 在 从 固定 到 可 塑 之 闻 的 连 
续 区 间 上 归 类 。 在 固定 的 一 端 ,你 可 以 找到 个 性 和 认 知 倾向 这 类 在 人 的 一 生 中 被 认为 相对 稳定 的 
特征 。 在 可 塑 的 一 端 ， 则 包括 任务 相关 技能 、 知 识 和 动机 等 这 些 被 认为 受 短期 环境 、 培 训 和 学 习 
影响 的 东西 ， 因 此 可 以 受到 人 为 操纵 ， 比 如 说 是 可 以 改善 的 。 

由 固定 特征 来 区 分 人 是 一 种 比较 快捷 、 便 宜 、 简 单 的 方法 ， 评估 和 发 展 人 的 技能 却 是 一 个 比 
较 漫 长 的 过 程 。 也 许 人 类 的 天 性 就 是 根据 一 些 模式 来 评价 人 ， 这 就 难怪 ， 招 聘 行业 会 有 一 系列 的 
测试 来 度量 一 个 人 的 固定 特征 。 

对 于 如 何 评价 一 个 人 , 我 们 有 着 各 种 各 样 的 意见 。 基 于 固定 特征 的 招聘 是 不 是 会 涉及 歧视 ? 
让 工作 人 员 参 加 智力 或 性 格 测试 会 不 会 不 道德 ? 在 一 些 国家 (特别 是 在 欧洲 ) ， 这 样 做 的 确 会 被 
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力 ， 还 是 由 可 塑 特征 ， 比 如 技能 和 专业 ， 决 定 的 呢 ? 


6.1.2 个 性 


个 性 已 经 在 编程 和 软件 工程 方面 受 关注 一 段 时 间 了 。 例 如 ，Weinberg 在 《程序 开发 心理 学 》- 
一 书 中 预测 到 “重视 个 性 将 对 提高 程序 员 的 表现 有 很 大 的 贡献 ” “并 在 1998 年 版 的 该 书 中 重申 
了 这 一 观点 中。Shneiderman 在 《软件 心理 学 》(Sofiware Psychology) 中 指出 :“ 个 性 因素 决定 了 
程序 员 之 间 的 互动 以 及 每 个 程序 员 的 工作 方式 。”' | 不过， 两 位 作者 都 承认 在 个 性 对 个 人 表现 的 
影响 上 缺乏 实验 证 据 ,， “依靠 个 性 测试 来 判断 谁 将 会 成 为 优秀 的 程序 员 并 不 很 成 功 ”“ “1, “不 
幸 的 是 我 们 对 于 个 性 因素 的 影响 也 知之 其 少 ”"。 

从 那 时 起 ， 人 们 已 经 开始 进行 针对 个 性 和 软件 开发 的 实证 研究 。 例 如 ，Dick 和 Zarnett 得 出 这 
样 的 结论 :“ 挑 选 具有 有 利于 结对 编程 必要 个 性 特点 的 人 组 成 的 开发 团队 ， 会 比 根据 纯 技 术 能 
组 建 的 团队 ， 在 极限 编程 上 获得 更 大 成 功 。 ”一 关于 具体 编程 任务 之 外 的 事宜 ，Devito Da Cunha 
和 Greathead 总 结 道 : “如 采 一 家 公司 根据 员工 的 个 性 类 型 和 桨 能 组 织 他 们 ， 工 作 效 率 和 质量 可 能 
会 得 到 改善 。。”“ 并且 有 人 认为 应 该 把 各 种 个 性 映射 到 软件 开发 的 特定 角色 上 1。 

那么 ， 什 么 是 个 性 ? 平时 我 们 总 是 能 谈 到 个 性 。 她 有 着 成 为 律师 的 完美 个 性 ”或 “他 的 个 性 
真 的 有 问题 。 的 确 ， 我 们 每 天 都 基于 这 样 非 正 式 的 直觉 做 出 重要 的 决定 。 也 许 其 中 一 些 后 来 被 证 
明 是 正确 的 ， 有 些 则 是 错误 的 。 采 用 循 证 方法 意味 着 用 系统 化 手段 ( 读 取 的 , 科学 的 ) 得 到 的 信息 
做 出 决定 。 需 要 说 明 的 是 ， 这 种 系统 化 的 做 法 有 其 内 在 的 局 限 性 ， 关 于 这 后 之 后 会 有 更 多 的 讨论 。 

首 允 必须 明确 , 征 否 有 可 能 定义 和 度量 个 性 。 这 应 该 是 可 能 的 ， 但 也 许 对 我 们 这 样 的 技术 人 
员 不 太 明 显 。 我 们 或 许 很 快 就 能 找到 切实 方法 来 识别 个 性 (比如 ， 遗 传 的 或 心理 生理 的 ) O, 2 
而 ， 个 性 理论 近 百 年 来 的 主要 发 展 一 直 遵 循 着 另 一 条 路 径 。 科 学 家 们 推 新 ， 我 们 所 谓 的 基于 人 们 
日 背 行 为 和 言论 的 “个 性 ”之 则 存在 差异 。 基 于 所 述 的 行为 和 语言 推论 的 研究 路 线 已 经 建立 了 一 
些 仿 人 信服 的 人 格 模 型 。 其 中 最 知名 的 也 许 是 “大 五 模型 (Big Five Model)”， 以 及 相关 的 “五 
因素 模型 (Five Factor Model)”( 参 见 以 下 的 “个 性 因素 ”)。 所 以 ， 是 的 , 个 性 是 可 以 定义 并 且 
度量 的 。 讨论 一 个 人 的 个 性 是 有 科学 意义 的 , 并 能 够 依 徘 测 试 确 定 一 个 人 的 个 性 。 科学 家 们 认为 ， 
我 们 已 经 构建 了 有 效 的 个 性 概念 。 

















个 性 因素 


个 性 模型 有 很 多 种 , 并且 每 种 模型 都 有 自己 的 测试 来 度量 个 性 ,个 性 测试 被 广泛 用 
于 商业 和 政府 活动 ， 比 如 招聘 、 职 业 咨 询 机 构 和 军队。 虽然 其 中 的 某 几 个 测试 源 于 心理 
学 研究 的 理论 和 实证 基础 , 但 是 它们 中 的 很 大 一 部 分 随 着 时 间 的 推移 出 于 某 些 目的 而 被 


@ The Psychology of Computer Proeramming， 作 者 为 Gerald Winberfg， 中 文 版 由 清华 大 学 出 版 社 出 版 。 一 一 译 者 注 
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简化 或 改变 ， 已 经 很 少 或 几乎 没有 什么 科学 依据 。( 个 性 测试 的 历史 和 重要 事件 请 参照 
Paul 的 报告 [91。 ) 

与 此 同时 ， 学 术 界 中 的 个 性 研究 建立 起 了 经 过 充分 研究 的 模型 和 测试 。 近 年 来 ， 有 
两 个 模型 起 到 了 主导 作用 四， 它们 由 五 个 因素 组 成 ， 被 叫做 五 因素 模型 (Five Factor 
Model, 2PFFM) 上 和 大 五 模型 (the Big Five) “中 FFM 认为 个 性 是 处 于 一 个 遗传 
素 、 环 境 影响 的 综合 模型 中 。 大 五 模型 认为 人 们 生活 中 最 重要 的 个 性 差异 会 在 他 们 的 自 
然 语 言 中 体现 出 来 ， 所 谓 的 词汇 假说 (Lexical Hypothesis) B23。 这 两 种 模型 往往 被 视 为 
一 体 ， 他 们 的 相关 因素 协调 地 相当 不 错 ， 例 如 参见 Goldberg FAM FRM, Rim, LH 
个 模型 在 概念 上 是 不 同 的 ， 理 论 依据 的 不 同 使 得 设计 测试 这 些 因素 的 方法 也 不 同 。 

这 5 个 因素 如 下 。( 描 述 摘自 Pervin 和 John 的 报告 (|,) 

(1) 外 向 性 

评估 人 际 交往 的 数量 和 深度 ， 活 中 程度， 刺激 需求 ， 喜 悦 的 能 

(2) 亲 和 性 

评估 人 际 关 系 取 向 的 特质 ， 思 想 、 情 感 与 行动 上 从 同情 到 对 立 的 程度 。 

(3) 尽责 性 

评估 个 人 在 目标 指引 下 行为 的 组 织 度 、 持 久 度 和 动机 。 将 可 靠 、 高 标准 严 要 求 的 人 
与 懒散 、 马 虎 的 人 作对 比 。 

(4) 情绪 稳定 性 /神经 质 

评估 情绪 调节 与 情绪 稳定 。 识别 容易 产生 心理 压力 、 不 切实 际 的 想法 、 过 度 渴望 或 
冲动 和 反应 不 适 的 人 群 。 

(5) 经 验 开 放 性 

评估 为 了 自我 而 寻求 体会 经 验 的 程度 ， 对 不 熟 坟 事物 的 已 耐 度 和 探索 性 。 

几 种 商用 模型 和 测试 在 学 术 界 因为 理论 基础 差 ， 可 靠 性 低 ， 有 效 性 低 而 受到 批 
ppls 71172] 特别 是 许多 性 格 测试 有 “Forer 效 应 ”?， 他 们 之 所 以 引起 所 有 人 共鸣 是 因 
为 其 描述 笼统 、 含 糊 ， 而 与 真正 的 个 性 并 没有 关系 。 


人 们 通过 多 种 方式 用 个 性 的 定义 对 人 进行 分 类 。 例 如 ， 按 照 大 五 模型 ， 我 们 发 现 程 序 员 属于 
同一 个 参考 群体 ， 即 外 向 性 较 低 ， 情 绪 稳 定性 较 低 ， 经 验 开 放 度 高 ”| 的 群体 。 相 关 结 果 另 见 
Moore!®!, Smith!ë®!, Woodruff”, Capretz''*!, Turley 和 Biemant "的 报告 。 程 序 员 们 作为 一 个 整 
体 也 更 加 趋同 ,也 就 是 说 ， 他 们 的 性 格 比较 相近 。 这 证 实 了 对 于 程序 员 的 刻板 印象 是 神经 质 、 内 
器、 聪明 ， 顺 便 说 一 下 ， 还 有 男性 (我 知道 一 些 人 认为 这 等 同 于 一 个 性 格 特征 ) 。 

正如 我 刚才 所 说 ,系统 的 科学 方法 除了 优势 之 外 也 存在 固有 的 局 限 性 , 而 这 种 局 限 也 部 分 来 





© B.T.Forer 对 他 的 学 生 做 了 一 个 个 性 测试 。 然 后 ， 他 丢弃 了 学 生 的 反馈 ， 从 占星 术 的 书 上 复制 了 完全 一 样 的 个 性 
分 析 给 所 有 学 生 ， 并 且 要 求学 生 们 用 从 低 到 高 五 分 来 评价 各 自 个 性 分 析 的 准确 度 。 评 估 结 果 的 平均 数 4.26。Forer 
重复 该 实验 无 数 次 ， 平 均 数 大 约 保持 在 4 “ 。 该 Forer 效 应 也 被 称 为 “ 巴 纳 姆 效应 ”” 。 
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源 于 它 的 优势 .其 中 一 个 限制 就 是 科学 家 们 所 称 的 内 容 效 度 :如 何 合理 地 证 明 个 性 定义 涵盖 了 所 
谓 ” 个 性 的 全 部 ?” 例 如， 大 多 数 人 不 认为 个 性 只 有 五 个 因素 。 其 他 模式 尝试 捕捉 更 复杂 有 的 类 型 ， 
并 创造 出 了 微妙 、 复 杂 的 人 格 因素 组 合 , 但 这 些 模 型 缺乏 建构 效 度 。 系 统 化 本 里 就 限制 了 在 哪些 
方面 能 够 系统 化 ! 这 里 我 们 过 到 了 典型 的 权衡 问题 。 人 简单 的 模型 (如 五 因素 ) 向 化 了 现实 ， 能 经 
得 起 验证 和 测量 。 更 复杂 的 模型 看 似 能 更 好 地 把 握 现 实 ， 但 难以 验证 。 

对 我 们 来 说 , 最终 的 问题 征 个 性 调 试 的 区 用。 个 性 上 的 一 氮 差异 会 造成 多 少 表 现 上 的 差 寞 呢 ? 
利用 一 个 人 的 个 性 来 预测 其 他 行为 ， 比 如 说 编程 效率 ， 有 多 大 的 可 行 性 呢 ? 已 经 有 大 量 研 究 分 析 
了 个 性 和 一 般 工作 绩效 之 间 的 关系 。 研 究 结 果 已 经 在 一 次 大 型 的 元 分 析 中 被 总 结 出 来 ，"""。 根 
据 Barrick 等 人 的 研究 , 个 性 对 于 工作 绩效 的 影响 是 有 些 令 人 失望 和 “即使 在 最 好 的 案例 中 …… 
也 是 一 般 的 ”“。 因 此 ， 个 性 对 工作 绩效 的 直接 影响 可 能 很 少 。 

不 过 , 个 性 的 社交 因素 可 能 会 通过 影响 团队 合作 而 对 工作 表现 间接 产生 重大 影响 。 事 实 上 , 大 
五 因素 对 团队 合作 的 影响 比 对 总 体 工作 表现 的 影响 大 "。 这 表明 , 研究 个 性 对 于 协作 的 影响 可 能 比 
研究 其 对 于 个 人 表现 的 影响 更 为 相关 。 我 们 通过 198 名 专业 程序 员 在 一 天 中 结对 编程 的 行为 表现 来 
研究 这 个 方面 ”。 结 果 发 现 ， 个 性 与 结对 编程 效率 的 关系 较 弱 。 即 使 是 粗略 度量 的 专业 度 、 任 务 
复杂 度 、 甚 至 程序 员 在 哪个 国家 受 雇 也 比 个 性 的 预测 能 力 强 。 这 项 研究 还 分 析 了 个 性 对 独立 编程 的 
影 啊 ， 以 及 结对 编程 效率 是 人 否 会 受 个 性 影响 每。 专业 度 和 任务 复杂 度 再 次 剖 于 个 性 的 预测 能 

顺便 说 一 下 ,一 件 事物 (本 文中 的 “个 性 ”) 对 另外 一 件 事物 有 多 大 的 预测 能 力 ， 被 称 为 效 
标 效 度 。 有 关 建 构 、 内 容 和 效 标 效 度 请 参照 “实证 科学 的 三 大 挑战 ”。 



































实证 科学 的 三 大 挑战 


假设 你 要 在 厨房 里 现 有 的 两 个 橱柜 之 间 装 一 个 新 的 橱柜 。 你 用 卷 尺 测量 了 一 下 安放 
的 空间 。 但 是 ， 你 注意 到 卷 尺 末 痛 的 金属 钳 看 起 来 安装 得 有 辟 马 虎 。 因 为 空间 很 有 限 ， 
所 以 你 必须 要 确保 可 用 空间 的 大 小 。 所 以 ， 以 防 万 一 ， 你 又 使 用 了 折 尺 (你 发 现 尺子 的 
两 端 也 有 不 正确 安装 的 金属 夹 )。 两 个 测量 结果 偏离 了 约 一 毫米 (A Rt, SÁT 
时 看 到 的 极限 值 )。 人 邻居 给 了 你 一 个 具有 数字 显示 的 激光 测量 设备 ， 但 它 的 精度 只 有 六 
毫米 。 人 似乎 你 永远 也 不 会 十 分 清楚 到 底 有 多 大 的 空间 ， 但 你 决定 购买 橱柜 ， 即 使 在 最 粳 
糕 的 情况 下 ， 你 觉得 橱柜 多 少 可 以 挤 一 挤 吧 。 

这 个 场景 中 你 的 问题 在 于 测量 的 工具 ,它们 都 不 够 精确 。 为 了 解决 这 个 问题 ， 你 用 
了 几 种 测量 仪器 增加 信心 ,至少 让 你 知道 不 会 差 得 太 远 。 你 也 许 感 觉 很 沁 夷 ,不 过 与 测 
量 非 物质 概念 相 比 ， 比 如 说 心理 特质 与 程序 员 的 水 平 ， 测量 物 理 对 象 (地 球 上 的 宏观 物 
Jt) 并 不 那么 困难 。 与 物理 对 象 不 同 ， 非 物质 的 概念 首先 很 难 定义 。( 在 某 种 意义 上 ， 
物理 对 象 也 存在 这 个 问题 。 我 们 并 不 真正 知道 物理 对 象 由 什么 组 成 和 它们 之 间 的 空间 ， 
不 过 使 用 我 们 对 于 “物理 对 象 ” 的 通常 理解 在 一 般 情况 下 不 会 有 什么 问题 ,) 

实证 科学 面临 的 第 一 大 挑战 就 是 建构 效 度 (construct validity): 你 怎么 知道 你 使 用 
的 测量 仪器 测量 了 你 想 测量 的 东西 , 或 者 说 首先 你 真 的 知道 你 要 测量 的 是 什么 东西 吗 ? 
一 个 概念 与 其 测量 手段 (其 指标 ) 一 并 被 称 为 建构 ， 参 见 图 6-1a。 例 如 ， 大 五 人 格 因 素 
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O 这 里 还 有 其 他 因素 : TAT 的 效 标 效 度 也 依赖 于 任务 活动 有 关 的 刺激 豆 励 ， 而 问卷 的 效 标 效 度 是 依赖 于 与 社会 成 就 
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模型 的 每 一 个 因素 是 由 20 个 问卷 问题 度量 得 出 ,， 因 此 “外 向 性 ”的 建构 表示 为 一 个 标 有 
“外 向 性 ”的 椭圆 形 ， 然 后 有 20 个 指标 框 指向 它 。 

通常 情况 下 , 建构 效 度 是 通过 自 上 而 下 并 自 下 而 上 地 攻破 问题 而 达成 的 : 一 个 人 设 
计 出 自 认 为 能 代表 所 度量 概念 的 度量 方法 , 这 么 做 的 同时 , 他 也 对 这 个 概念 有 了 更 充分 
的 了 解 ， 然 后 指引 他 设计 进一步 的 度量 方法 ， 如 此 自 举 式 反复 。 人 和 任何 测量 方法 都 需要 遵 
守 一 定 的 统计 标准 , 这些 标 准 被 执行 的 程度 保证 了 建构 的 质量 和 意义 。 实 现 高 建构 效 度 
是 很 困难 的 , 而 且 通 常 需要 多 年 的 研究 才能 使 它 有 实用 价值 。 商业 应 用 通常 没有 时 间 这 
么 做 或 者 根本 不 关心 ， 因 此 ， 世 界 上 那么 多 的 测试 事实 上 可 能 什么 都 没有 测量 到 ! 

第 二 大 挑战 是 内 容 效 度 (content validity) 。 一 个 建构 代表 了 一 个 概念 中 有 科学 对 照 
的 部 分 。 然 而 ， 重 要 的 是 要 记 住 ， 建 构 可 能 不 仅仅 代表 一 个 概念 。 内 容 效 度 ， 表 示 了 一 
个 建构 在 何 种 程度 上 合理 捕获 了 我 们 对 一 个 概念 的 理解 ， 见 图 6-1b， 其 中 一 个 建构 被 视 
为 只 履 盖 了 一 个 概念 的 一 小 部 分 。 人 们 需要 不 停 地 努力 以 确定 是 否 应 该 扩大 概念 中 受 科 
学 对 照 的 区 域 (图 6-1b 中 的 虚线 椭圆 形 )。 科 学 最 傲慢 的 地 万 之 一 ， 就 是 声称 它 所 控制 
的 就 是 一 切 ， 如 智商 测试 测量 了 人 类 的 全 部 智慧 。 

第 三 大 挑战 是 效 标 效 度 (criterion validity) 。 这 涉及 一 项 建构 能 否 用 于 预测 其 他 建 
构 中 的 变化 。 你 可 以 使 用 个 性 预测 编程 效率 吗 ? 可 以 用 编程 技巧 来 预测 一 名 开发 人 员 在 
下 一 个 大 型 开发 项 目 中 的 效率 吗 ? 如 此 种 种 。 见 图 6-1c， 一 个 建构 中 的 变化 〈 即 预测 ) 
预示 着 第 二 个 建构 中 的 变化 ( 效 标 )。 

这 里 人 们 很 容易 犯错 ， 混 消 建 构 效 度 和 内 容 效 度 。 例 如 ， 如 果 你 想 定 义 一 个 合作 的 
“建构 ” ， 然 后 想 用 这 个 建构 来 预测 球 队 表现 的 建构 。 很 容易 简单 地 把 合作 定义 为 会 带 来 
好 或 坏 的 表现 的 建构 ,也 就 是 说 ， 好 的 合作 是 一 切 带 来 出 色 成 绩 的 合作 。 这 就 自动 给 出 
了 好 的 效 标 效 度 ， 但 实际 上 ,合作 建构 本 身 并 不 是 一 个 真实 的 建构 。 相 反 ， 它 只 是 团队 
表现 的 一 个 方面 。 





个 性 影响 也 很 有 可 能 在 一 段 时 间 之 后 才 表 现 出 来 。 如 采 结 对 编程 只 进行 一 天 ,双方 的 个 性 影 
能 不 会 十 分 明显 。 几 乎 能 自动 进行 的 短 时间 测 验 〈 如 个 性 与 智力 测验 ) 








效 度 再 次 受到 挑战 ! 还 要 注意 的 是 , 度量 实际 生 话 中 的 长 期 表现 比 度量 实验 室 可 控 条 件 下 的 
要 难得 多 。 





相关 的 刺激 鼓励 。 这 表明 ， 研 究 成 条 没有 想象 的 那么 独立 ， 但 它们 仍然 是 值得 芳 虑 的 。 


与 需要 专家 分 析 的 整 
估 方 法 之 间 ， 也 存在 和 争论。 以 一 个 “渴望 成 就 ”的 人 格 特质 为 例 。 元 分 析 认 为 ， 有 和 争议 的 主 
觉 测 验 在 被 用 于 测量 “渴望 成 就 ”特质 时 ， 实 际 预测 的 有 效 性 比 标准 问卷 更 好 。 而 以 标准 问 
基础 的 测试 , 在 受 控 环境 中 的 预测 性 能 较 好 吧 。*TAT 继 续 受到 科学 界 的 怀疑 。 然而 , Spangler 
说 :“ 科 学 方法 可 能 会 不 经 意 地 最 小 化 了 个 体 表达 差异 、 个体 互动 差异 和 环境 特性 ”这 里 你 的 
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建构 





(a) 内 容 效 度 





(b) 内 容 效 度 
预测 物 效 标 





(c) 效 标 效 度 
图 6-1 有 效 性 类 型 
总 之 , 个 性 似乎 不 是 一 个 非 第 强大 的 效率 预报 絮 。 让 我 们 人 简要 地 看 看 有 哪些 影响 因素 。 一般 
情况 下 ， 预 测 学 术 和 工作 表现 时 , “责任 心 ” 是 最 持久 稳固 的 个 性 因素 ”。 然 而 结对 编程 中 恰恰 
并 不 如 此 [3。 事 实 上 ， 我 们 在 数据 中 甚至 发 现 ， 责 任 心 有 负 面 效 果 (也 适用 于 独立 的 程序 员 )。 
看 似 有 积极 作用 的 是 经 验 开放 性 53 和 不 同 水 平 的 外 向 性 [0。 不 用 外 向 性 水 平 的 结对 比 水 平 相似 的 
结对 工作 得 更 快 。 


6.1.3 ÆJ 
有 一 位 大 型 软件 开发 公司 的 人 事 经 理 曾 表示 , 如 琳 有 机 会 试用 一 种 科 学 验证 过 的 测试 来 度量 
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编程 能 力 的 话 , 预测 编程 效率 有 且 仅 有 一 个 因素 , 即 智商 。 这 种 观点 很 有 意思 , 也 相当 说 明 问 题 : 
在 茶 种 意义 上 ， 它 并 没有 错 ， 但 它 太 过 离谱 ， 会 引 你 走 上 一 条 错误 的 道路 。 

一 般 心理 能 力 (General Mental Ability, GMA) 是 一 个 智力 或 认 知 上 非常 笼统 的 概念 ， 被 认 
为 存在 于 每 个 人 。 这 就 是 智商 测试 大 体 上 测量 的 东西 。 更 多 关于 “智力 ”的 内 容 请 参阅 下 面 的 “ 管 
力 因 素 ”。GMA 是 一 个 相当 好 的 预测 学 习 能 力 的 指标 ”“。 换 言 之 ，GMA 高 的 人 会 比 GMA 低 的 人 
更 快 地 学 习 新 任务 。GMA 也 可 以 相当 不 错 地 预测 没有 经 验 的 员工 未 来 的 工作 表现 “。 因 此 ， 如 
本 我 们 的 人 力 资 源 经 理 四 要 殿 用 没有 任何 大 型 复杂 系统 工作 经 验 的 程序 员 时 ,她 也 许 役 有 错 ， 的 
确 应 该 考 祭 他 们 的 智商 。 

GMA 的 效 林 依赖 于 手头 任务 的 类 型 。 如 末 一 直 以 来 ， 示 个 任务 的 最 佳 表 现 者 总 是 用 相似 的 
策略 来 解决 它 ， 那 我 们 认为 这 个 任务 是 稳定 的 。 而 不 稳定 的 任务 ， 则 是 用 不 同 的 方法 来 解决 的 。 
当 人 们 在 稳定 的 任务 上 获得 了 技能 之 后 ,智力 水 平 的 影响 在 经 过 一 段 时 间 后 会 减 小 , RETES 
效 会 依赖 于 其 他 因素 ， 如 经 验 和 培训 “ ” 。 高 度 依赖 于 相关 领域 知识 的 任务 ， 比 如 软件 开发 
等 , 就 是 如 此 ”1。 软件 开发 总 的 来 说 , 特别 是 编程 , 同时 带 有 稳定 和 不 稳定 的 任务 。 这 意味 着 ， 
智力 固然 重要 ， 但 不 是 全 部 。 对 于 有 经 验 的 工作 者 来 说 ，GMA 本 身 并 不 是 终极 预报 器 A, 
那么 究竟 什么 是 终极 预报 器 呢 ? 答案 是 : 智力 和 技能 ”。 

这 些 研 究 告诉 我 们 单单 依 徘 GMA 长 期 来 说 是 不 明知 的。GMA 有 的 问题 在 于 它 过 于 笼统 。 它 被 
认为 是 普 轴 存在 的 人 类 特征 ， 而 测量 手段 被 故意 设计 成 与 任何 任务 领域 无 天 。( 依 赖 GMA 的 缺点 
也 包括 ， 人 们 观察 到 GMA 并 不 那么 普遍 ， 它 也 依赖 于 其 他 东西 ， 比 如 说 文化 “。) 这 就 是 说 ， 如 
A OR ADS Ne FAAS PEA, 除了 需要 评 佑 普 过 能 力 之 外 , 也 需要 评 佑 一 些 与 工作 相关 的 
东西 。 

















智力 因素 

现代 科学 观点 中 的 智力 包括 几 个 方面 。 一 个 被 许多 研究 人 员 接受 的 智力 模型 是 ,， 目 
洛 尔 模型 "“"， 它 包括 以 下 8 个 主要 因素 。 

Gf: 流体 推理 

Ge: 涵 化 知识 

SAR: 短期 理解 与 短期 工作 记忆 (STWM) 

TSR: 长 期 记忆 

Gv: 视觉 处 理 

Ga: 听觉 处 理 

Gs: 加 工 速 度 

Gq: 数理 知识 

这 些 因素 (每 一 个 都 有 一 些 子 因素 ) 包括 被 怀疑 有 与 文化 相关 的 部 分 (如 Gc, 涵 化 
知识 ， 个 人 吸收 主流 文化 知识 和 语言 的 程度 ， 这 就 是 为 什么 智商 测试 没有 公平 对 待 少数 
族 裔 的 原因 ), 和 独立 于 文化 之 外 的 东西 (如 Gf, 流体 推理 , 它 代 表 在 短期 内 的 推理 能 力 )， 

很 少 有 实验 证 据 能 证 明 一 般 智力 (GI) 中 存在 一 个 包罗 万 象 的 因素 ， 即 使 几 个 研究 
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人 员 已 经 提出 了 一 个 后 。 此 前 ，Spearman 认 为 [5 ， 他 的 “智力 概念 ”( 简 称 g) RAT 
力 的 本 质 ， 但 这 个 概念 现在 已 被 视 为 Gf 因素 的 一 个 对 应 。 我 们 本 章 所 说 的 “一 般 ' 心 理 能 


A” (GMA) 实际 上 是 Gf 和 Gc 的 混合 物 趾 ， 参 见 图 6-2。 这 些 因 素 之 间 有 着 依赖 关系 ，。 
例如 Gf 辅助 Gc 的 建立 。 还 有 证 据 表 明 ， 一些 因素 会 随 着 年 龄 的 增长 而 退步 


bésan 


图 6-2 ”智力 因素 





6.1.4 ”编程 任务 


人 们 常用 工作 样本 测试 (work-sample test) 来 测量 技能 。 这 些 测 试 由 小 的 ， 具有 代表 性 的 任 
务 组 成 。 该 定义 提出 了 两 项 挑战 :“ 小 ”和 “代表 性 ”"。 如 琳 你 想 测 试 淆 在 员工 或 在 职员 工 的 编程 
技能 , 你 想 要 用 尽 可 能 少 的 时 间 。 因 此 , 测试 任务 需要 比 在 正常 工作 中 融 到 的 任务 小 很 多 。 但 是 ， 
你 直 么 能 确定 测试 内 容 的 相关 度 ? 这 束 古 代表 性 的 问题 了 。 

事实 上 , 在 这 里 你 再 次 过 到 建构 效 度 和 内 容 效 度 : 你 怎么 知道 你 的 测量 手段 测量 了 你 想 要 的 
东西 ， 首 先 你 真 的 知道 你 要 测试 什么 吗 ? 讨论 “个 性 ”时 我 们 提 过 这 样 的 问题 ， 对 于 “智力 我 
们 也 问 了 同样 的 问题 (虽然 我 们 并 没有 对 此 做 文 草 )， 在 “编程 技能 ”上 还 是 有 这 样 的 问题 : 定 
义 “ 编 程 技 能 ”( 这 包括 定义 编程 任务 )， 然 后 制定 一 个 快速 测试 。 一 般 来 说 ， 工 作 样 本 测试 的 建 
构 效 度 是 有 问题 的 “。 

我 们 正在 研究 实验 室 里 开发 一 种 测量 手段 以 评估 编程 技能 。 它 基于 工作 样本 测试 。 工 作 样 
本 测试 由 小 型 到 中 型 的 编程 任务 组 成 , 随 着 对 编程 技能 概念 的 不 断 了 解 ， 我 们 会 精心 选 定 、 禁 换 
和 修改 这 些 测 试 。 

该 测量 手段 主要 基于 测量 理论 并 符合 严格 的 统计 标准 。 它 也 基于 技能 和 专业 知识 的 理论 , 这 
些 都 是 为 了 保证 建构 效 度 。 因 此 ,该 手段 有 双重 保障 : 它 一 方面 跟踪 任务 难度 ,一 方面 跟踪 完成 
任务 者 的 技能 。 与 智力 和 个 性 相似 , 个 人 评 佑 结 来 古 相 对 于 其 他 参与 测试 的 人 群 的 。 与 智力 和 个 
性 不 同 的 是 ， 编 程 技能 与 任用 和 留 住 优 秀 的 程序 员 直 接 相关 。 


6.1.5 ”编程 表现 
那么 ,什么 是 出 色 的 编程 表现 ?显然 ， 代 码 质量 是 一 个 度量 标准 。“ 高 质量 ”代码 的 定义 一 
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直 是 讨论 的 焦 颇 。 但 对 于 工作 样本 测试 ， 有 一 些 明 显 的 人 循 证 度量 标准 ， 如 功能 的 正确 性 ， 继 承 深 
度 等 。 另 一 个 度量 标准 是 编写 代码 所 人 花费 的 时 间 。 编 写 高 质量 代码 化 的 时 间 越 少 越 好 。 你 可 能 认 
为 这 两 个 标准 在 相互 冲突 ， 人 们 需要 更 多 时 间 来 编写 更 高 质量 的 代码 。 这 未 必 是 真 的 ”” 。 对 于 
未 些 编程 任务 ， 一 名 程序 员 不 是 “ 行 ” 就 是 “不 行 ， 如 末 行 ， 他 就 能 很 快 完成 它 。 对 于 其 他 的 
编程 任务 ， 花 更 多 的 时 间 能 得 到 更 好 的 解决 办 法 。 重 要 的 是 要 知道 任务 征 属 于 哪 一 种 类 型 的 。 


6.1.6 ”专业 技能 


技能 是 可 以 改进 的 。 在 专业 技能 和 学 习 领 域 什么 是 真正 的 技能 以 及 如 何 改善 它 ， 有 着 十 分 广 
浸 的 研究 。 专 业 技 能 一 般 阅 来 《而 特殊 技能 只 有 在 特殊 情况 下 ) 关系 到 一 个 特定 任务 或 一 组 任务 。 
这 与 性 格 和 智力 明显 不 同 。 

除了 技能 ， 专 业 技 能 还 包括 其 他 方面 。 专 家 知识 《在 此 是 编程 知识 ) 是 专业 技能 重要 的 组 成 
部 分 。 经 验 〈 在 此 指 编程 经 验 ) 也 是 如 此 ， 请 参见 后 面 的 “专业 技能 的 构成 要 素  。 这 些 要 素 之 
间 有 依 束 关系。 例如， 经验 促 成 知识 ， 知 识 促成 技能 。 














专业 技能 的 构成 要 素 
专业 技能 包括 几 个 方面 的 内 容 户 ]。 
(1) 持续 经 验 
(2) 章 越 的 知识 表现 和 组 织 ， 具 体 分 为 |: 
O 专家 知识 ; 
口 专家 推理 ; 
口 专家 记忆 。 
(3) 在 典型 任务 上 的 可 靠 的 出 色 表 现 (所 谓 的 专家 表现 ) 
专业 技能 通常 与 给 定 领 域 中 的 特定 任务 相关 。 在 某 项 任务 上 是 专家 并 不 意味 在 其 他 
任务 上 也 是 专家 。 
度量 专业 技能 的 各 方面 时 必须 十 分 谨慎 。 例 如 ， 对 于 持续 经 验 (第 一 个 方面 ) ， 往 
往 相 当 简 单 地 用 工作 年 数 来 度量 , 但 相关 度 更 高 的 度量 方法 是 更 多 地 考虑 与 特定 任务 相 
关 的 经 验 站 R81， 卓越 的 知识 表现 和 组 织 (第 二 个 方面 ) 更 偏重 专业 技能 中 的 认 知 方面 。 
人 们 也 第 用 工作 年 数 来 度量 这 个 复杂 的 概念 ， 因 为 度量 一 个 人 的 认 知 结构 并 不 容易 。 人 
们 也 假定 优秀 的 心理 表征 (mental representation) 是 随 着 相关 工作 经 验 的 积累 而 发 展 起 
来 的 。 这 种 情况 比较 常见 ,但 并 不 一 定 如 此 。 当 具体 谈 到 技能 时 ,通常 指 在 具有 代表 性 
的 任务 ( 即 工作 样本 ) 上 的 优秀 表现 (第 三 个 方面 )。 
专业 技能 中 另外 两 个 被 广泛 认可 的 方面 如 下 。 
口 “稳定 ”任务 的 专业 技能 是 渐 近 式 增 强 的 。 存 在 一 个 任何 人 都 不 可 能 达到 的 最 优 表 
现 。 对 于 “不 稳定 ”的 任务 ， 这 一 点 就 不 好 度量 了 。 
口 专业 出 自 实 践 。 如 果 停 止 实践 ， 你 的 专业 技能 将 有 可 能 下 降 到 你 的 最 佳 水平 之 下 。 
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智力 能 帮助 获得 技能 ， 但 它 并 不 能 决定 技能 。 根 据 Cattell 的 投资 理论 ， 在 需要 深入 洞察 复杂 关系 
的 学 习 阶 段 ,“ 投 资 ”Gf (所 谓 的 流体 推理 ， 或 短期 解决 问题 的 能 力 ， 见 “智力 因素 ") 有 利于 获取 
知识 和 技能 。 最 近 有 证 据 表 明 , 这 个 理论 也 适用 于 编程 史 , 参见 图 6-3。 在 这 里 , 工作 记忆 容量 (WMC) 
标 代 了 Gf。WMC 对 编程 知识 具有 巨大 的 正面 影响 ， 从 而 积极 地 影响 了 编程 技能 。 然 而 ，WMC 对 编 
程 技能 的 直接 影响 似乎 是 微不足道 的 ! 换 句 话说 ，WMC 并 不 会 直接 提高 一 个 人 的 技能 ， 它 只 是 促进 
了 知识 的 获得 。 同 样 ， 编 程 经 验 间 接 〈 而 不 是 直接 ) 影响 了 编程 技巧 ， 但 设 有 WMC 影 响 大 。 





编程 经 验 





编程 技能 


图 6-3 ”编程 技能 的 投资 理论 [Bergersen and Gustafsson 2010] 


这 一 切 证 明了 ， 对 于 获取 技能 来 说 ， 智 力 是 一 笔 财 雷 。 如 东 你 希望 找到 优秀 的 程序 员 ， 而 且 
必须 要 测试 他 们 的 智力 ， 那 束 汕 试 吧 ， 别 犹豫 E, AES, RERE aot 
们 的 编程 技能 。 

成 功 既 需 要 智力 也 离 不 开 技 能 。 这 样 把 智力 与 专业 技能 放 在 一 起 来 看 待 能够 把 注意 力 吸 ?| 到 
好 的 方面 ， 让 人 更 加 关 广 问题 本 身 ， 而 把 犀 性 也 更 小 。 事 实 上， 人们 正 努 力 把 智力 与 专业 技能 合 
并 为 一 个 统一 的 理论 ， 见 下 面 的 “合并 智力 和 专业 技能 。 这 里 的 共同 点 是 在 大 脑 中 的 认 知 结构 。 
它们 有 些 征 稳定 的 ， 有 些 随 着 年 龄 而 退化 ， 有 些 通过 有 意 的 练习 能 得 到 改进 。 








合并 智力 和 专业 技能 

认 知 结构 是 智力 和 专业 技能 的 基础 。 人 们 已 经 努力 将 这 两 个 认 知 主题 合并 为 一 个 专 
业 技 能 与 智力 的 交 又 理论 “1。 有 趣 的 对 比 随 之 产生 : Gf (流体 推理 ) 是 从 第 一 原理 (first 
principles) 归纳 得 出 的 (例如 ， 国 际 象 棋 的 规则 )， 而 专家 论证 是 演绎 推理 的 (例如 ， 
从 遇 到 过 的 和 学 习 到 的 成 套 象棋 位 置 中 推理 的 ) 。SAR 是 从 短期 工作 记忆 得 到 ， 它 拥有 
七 (加 减 二 ) 块 信息 ， 而 专家 似乎 科 能 够 利用 其 专业 领域 的 专家 工作 记忆 ， 这 比 SAR 的 
短期 工作 记忆 多 得 多 。 Gs 是 指 回忆 没有 价值 的 任务 的 速度 ,专家 认 知 速度 是 指 回忆 特定 
领域 事物 的 速度 。 因 此 人们 在 已 有 8 个 方面 的 智力 中 加 入 3 个 新 的 方面 ， 然 后 获得 一 个 
组 合理 论 。 

ExpDR: 专家 演绎 推理 。 

ExpSAR: 短期 理解 和 专家 工作 记忆 检索 (ExpWM) 。 

ExpCS: 专家 认 知 速度 。 
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6.1.7 ”软件 工作 量 估算 


那么 , 其 他 软件 工程 任务 呢 ? 它们 能 习 得 吗 ? 习 得 任务 后 所 产生 的 技能 可 以 锌 度量 吗 ? 让 我 
们 来 看 看 一 个 出 了 名 的 环 手 任务 : 软件 工作 量 估算， 就 是 估算 软件 开发 工作 量 的 任务 。 

软件 系统 开发 一 直 丰 一 个 复杂 的 过 程 。 舍 算 一 个 大 型 软件 开发 项 目 工作 量 的 复杂 度 更 高 。 该 
任务 的 困难 度 所 产生 的 明显 影响 是 : 软件 开发 的 工作 量 估算 不 准确 ,通常 都 偏 低 很 多 ”，; 软件 开 
发 专业 人 士 对 他 们 的 估算 总 显得 信心 过 高 ”; 估算 通常 是 不 可 靠 的 , 同一 个 人 在 不 同 场合 对 相同 
任务 会 有 不 同 的 判断 ” 。 在 过 去 几 十 年 来 中 ， 估 算 精 度 似 乎 没有 实质 性 的 改善 (以史为鉴 )， 从 
结果 反馈 中 学 习 似乎 也 很 困难 ”。 

除了 复杂 性 之 外 , 我 们 知道 ， 人 们 在 预测 一 项 佑 计 中 的 判断 过 程 ， 受 制 于 一 系列 无 意识 的 过 
程 ”“ 9。 例如， 只 要 事先 告诉 人 们 各 种 基础 估算 ,估算 就 很 容易 被 操纵 ( 即 锚固 效应 )。 
人 们 的 判断 过 程 也 对 估算 时 所 得 到 的 信息 本 质 和 信息 格式 很 敏感 (如 需求 文档 ) PUPPIES Bi 
如 , 问 一 个 人 需要 多 少时 间 来 完成 一 定量 的 工作 , 与 器 他 在 一 个 给 定 的 时 间 内 可 以 完成 多 少 工作 ， 
有 很 大 的 区 别 。 后 者 是 敏捷 开发 中 时 间 盒 (time boxing) 的 做 法 。 结 末 呢 ?使 用 时 间 盒 会 增加 低 
估 的 情况 。 此 外 ， 时 间 盒 似乎 扭转 了 高 估 小 任务 工作 量 却 低 估 大 任务 工作 量 的 倾向 ”。 

与 编程 任务 不 同 ， 并 不 征 佑 算 软 件 开发 工作 量 次 数 越 多 ， 就 会 做 得 越 好 。 有 证 据 表 明 ， 对 佑 
算 精 度 的 在 职 反 馈 (无 论 是 被 动 的 、 历 史 数 据 形式 的 ， 或 是 主动 的 、 直 接管 理 评估 形式 的 ) 并 不 
能 改善 过 于 乐观 、 过 于 目 信 或 估计 不 可 靠 的 问题 。 根 据 经 典 学 习 理 论 ,， 这 表明 需要 更 精确 的 反馈 
和 更 积极 的 技能 培训 (所谓 的 刻意 练习 )。 换 言 之 ， 需 要 有 意识 、 有 目的 地 训练 估算 技能 。 

但 问题 是 : 这 可 能 吗 ? 针对 性 的 培训 要 求知 道 针 对 的 目标 是 什么 。 换 言 之 ， 一 个 人 需要 知道 
什么 是 估算 的 专业 技能 。 但 是 ， 当 涉及 软件 项 目 工 作 量 估算 时 ,专业 技能 的 本 质 似乎 在 典 避 着 我 
们 ， 它 不 容易 被 观察 到 ， 因 为 有 经 验 的 项 目 经 理 并 没有 比 没有 经 验 的 估算 者 好 多 少 ,并 且 专 业 技 
能 的 理论 基础 没有 明确 告诉 我 们 这 里 的 专业 技能 到 底 是 什么 。 此 外 , 软件 工作 量 估计 属于 所 谓 的 
定义 不 明 ”的 任务 。 它 们 的 成 功 策 略 其 至 邦 难 以 定义 ， 这 一 点 仅 比 “不 稳定 ”任务 强 一 些 。 无 
论 是 软件 工作 量 佑 算 这 项 任务 本 壬 ， 或 是 做 好 这 项 任务 所 需 的 专业 技能 ， 都 不 在 科学 向 控 之 中 ，; 
换 句 话说， 我 们 仍 在 两 个 概念 的 建构 效 度 中 挣扎 。 
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现在 我 们 转 到 本 半 开 始 时 的 第 三 个 问题 。 我们 现在 可 以 把 它 表达 得 更 精确 一 点 了 。 如 琳 知 道 
了 不 容易 度量 软件 开发 人 员 的 专业 技能 的 话 ， 你 应 该 专 广 于 工具 和 技术 吗 ? 想象 一 个 政策 制定 
者 ， 她 需要 负责 减少 道路 磁 撞 事故 的 数量 和 严重 程度 。 道 路 事故 是 导致 全 世界 10 多 至 19 光 儿童 死 
亡 的 主要 原因 , 在 美国 可 预防 的 死亡 原因 中 排名 第 六 。 她 应 该 优先 考虑 提高 司机 的 驾驶 技术 和 和 意 
识 ， 还 是 应 该 化 更 多 的 钱 建立 环境 保障 措施 ， 如 改善 道 路 标准 ， 降 低 车 速 限制 , 或 者 争取 在 汽车 
上 增加 更 安全 的 功能 呢 ? 你 可 能 说 这 两 种 都 需要 做 ， 但 在 有 限 的 预算 下 呢 ， 每 项 要 做 多 少 呢 ? 

道路 交通 磁 撞 事故 的 研究 还 算 处 于 一 个 笠 运 的 位 置 : 全 球 有 巨大 的 数据 可 供 分 析 。 因 此 , 合 
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理 地 决定 在 哪里 投入 资源 是 可 能 的 。 软件 工程 还 没 到 可 以 做 出 这 样 明确 决定 的 位 置 上 。 我 们 没有 
足够 的 数据 ， 而 且 我 们 的 任务 非 第 多 样 。 


6.2.1 软件 工程 中 应 该 提高 技能 还 是 提高 安全 保障 


编程 能 力 正 变 得 可 度量 。 这 意味 着 我 们 能 更 好 地 领会 编程 任务 本 身 以 及 专家 程序 员 意 味 着 什 
么 。 我 们 在 建构 效 度 上 已 经 取得 了 进展 〈 也 就 是 我 们 的 度量 方法 一 直 能 反映 编程 技术 和 任务 的 难 
RE), ， 而 且 也 正在 提高 内 容 效 度 和 效 标 效 度 《我们 正 致力 于 提高 对 编程 技能 和 任务 难度 概念 的 科 
学 把 握 , 并 通过 实际 编程 中 的 成 功 来 验证 建构 )。 这 使 得 建立 和 改善 程序 员 的 塔 训 计 划 变 得 可 能 。 

软件 工作 量 估算 却 并 非 如 此 。 预 济 一 个 团队 或 者 一 个 项 目 需 要 多 大 的 工作 量 来 开发 系统 的 一 
些 部 分 ， 总 的 来 说 还 不 在 我 们 所 理解 的 范围 内 ,也 设 有 到 达 可 以 可 乱 地 度量 任务 难度 和 估算 技术 
的 程度 ， 这 也 意味 着 我 们 还 不 知道 如 何 培训 人 们 提高 这 方面 的 表现 。 

但 我 们 知道 ， 改 郑 坏 境 是 有 帮助 的 。 这 里 有 几 个 例子 : 从 需求 文件 中 删除 无 关内 容 ， 不 让 不 
确定 的 基础 估算 影响 思考 ; 估算 最 可 能 的 工作 量 之 前 先 估算 理想 工作 量 ” 。 这 些 措施 都 是 为 了 改 
变 判 断 ( 即 估算 ) 发 生 的 环境 ， 其 目的 是 为 了 减少 人 们 在 做 判断 时 已 知 的 心理 偏见 。 其 他 环境 措 
施 包括 : 团体 估算 , 一般 比 单个 估算 更 准确 ; 使 用 适当 的 过 程 模型 ， 迭 代 开 发 的 估算 往往 比 接力 
式 开发 好 。 开 发 支持 所 有 这 些 环境 措施 的 工具 和 技术 是 可 能 的 。 

结对 编程 (在 Laurie Williams 撰 写 的 第 17 任 中 有 讨论 ，Jason Cohen 朱 写 的 18 音 也 有 一 小 部 分 
相关 内 容 ) 就 是 采用 环境 措施 改善 代码 生产 效率 的 一 个 例子 。 人 们 依 徘 社交 过 程 而 不 是 程序 员 有 自 
己 来 提高 单个 程序 员 和 团队 的 工作 效率 。 重 要 的 是 要 知道 在 何 种 情况 下 结对 是 有 益 有 的。 例如 ， 结 
对 似乎 对 新 手 参 与 复杂 的 编程 任务 最 有 益 ”， 也 可 以 参阅 Hannay 等 人 “或 Dybi 等 人 ”关于 元 分 
析 方 面 的 内 容 。 


























6.2.2 合作 


团队 合作 和 协作 现在 非 第 流行 。 例如， 人 们 通 和 常 认为 利益 相关 各 方 参与 软件 开发 过 程 是 有 益 
的 。 因 此 ，5| 入 更 明确 的 合作 关系 是 一 个 主要 的 环境 推动 力 。 

应 该 值得 看 一 下 究竟 什么 是 成 功 的 合作 。 因 此 ,我们 应 该 观察 一 下 人 们 和 是 如 何 合作 的 ， 而 不 
是 (或 者 说 除了 ) 观察 个 性 。 人 们 对 于 合作 、 团 队 组 成 、 群 体 过 程 (group process) 有 着 诸多 研 
究 。 事 实 上 ， 几 乎 是 太 多 了 1! 我 曾 试图 找 出 与 结对 编程 有 关 的 基本 群体 过 程 〈 见 图 6-4) ， 但 我 很 
快意 识 到 ， 除 非 知 道 合 作 征 什么 样 的 ， 否 则 就 不 可 能 决定 运用 那 种 理论 。 相 当 一 部 分 研究 人 员 经 
常会 事后 为 他 们 的 观察 生 搬 硬 套 一 些 理论 ”“。 这 样 做 很 容易 所 以 也 经 常 发生 。 因 为 总 是 有 一 些 理 
论 是 适合 的 ! 例如 ， 社交 促进 或 许可 以 解释 为 什么 团队 表现 民 好 ， 而 社交 抑制 或 许可 以 解释 为 什 
么 一 文 团队 表现 得 不 好 。 所 以 , 你 可 以 使 用 这 两 种 理论 中 的 任何 一 种 来 解释 任何 可 能 观 罕 到 的 结 
末 。 当 然 ， 只 有 当 你 真 的 不 知道 是 怎么 回 事 时 ， 这 才 可 能 。 因 为 如 来 你 知道 ， 你 应 该 就 会 看 到 ， 
至 少 一 个 理论 的 育 后 运作 机 制 与 事实 不 相符 。 
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时 间 上 的 熟悉 度 (Lvi) 





长 时 间 的 合作 。， 






任 会 身份 参阅 [Tajfel、\ 
Turner 1986] 


流程 所 得 | 
(GLAS Eb es BET 社会 补偿 (上 升 的 ) 


[Stroebe 1996 
Karav 1991 
















C ”感知 到 的 任务 重要 性 





要 社会 劳动 参阅 [Karau,、 一 对 于 成 员 来 说 的 
ee Williams 1993] 团队 重要 性 
ak 
gY ay" 
RVA SL Ah file 
ee” PS 社会 补偿 (上升 的 ) 


、 参 阅 [Karau, Williams, Stroop 任 务 
1993] GEEZ) | 


/ 任务 复杂 度 
缩小 的 焦点 (隧道 


视野 ) 参阅 [Monteil, L-A y, ERME 
= Huguet 1999] (学 习 过 的 任务 ) 


心理 上 IN y 
C281 > 驱动 “主要 反应 ， 参 阅 


[Steiner 1972 
对 团队 效率 和 团队 学 习 的 影响 


人 际 理解 (专家 抑制 |) 


对 峙 打破 规范 ” 社会 抑制 (需要 
与 其 他 团队 的 关系 学 习 的 任务 ) 












提供 反馈 (领航 员 帮 助 ) 

明确 的 程序 

力量 域 (专家 力量 ， 自 我 形象 ， 专 家 自尊 ，) 
[为 什么 专家 不 合作 |] 









流程 所 失 


”任务 特征 (可 加 
的 ， 可 析 取 的 ) 







实际 产品 = 潜在 产品 过 程 所 尖 
© 名义 上 的 团体 vs 现实 团体 ) 
参阅 [Steiner 1972] 











E, S 
[Paulus, Dzindolet 
1993] 




















《社会 影响 ， 参 阅 
[Latane 1981 | 


阻碍 ， 参 阅 [Diehl， 


> LATE, Biel 
Stoebe 1987] 


[Latane 1981] 










图 6-4 ”理论 太 多 了 【如果 你 不 知道 到 底 怎么 回 事 的话 ) 


为 了 找 出 结对 编程 中 的 合作 古 如 何 进 行 的 , 我 们 听 了 43 对 专业 程序 员 在 解决 一 个 结对 编程 问 
题 时 的 录音 带 。 合作 方式 根据 他 们 的 对 话 进行 分 类 ”。 我 们 所 用 的 分 类 策略 是 用 自 举 的 方式 开发 
的 ， 既 从 现 有 的 策略 开始 目 上 而 下 构建 ， 也 根据 录 首 当中 明显 而 具体 的 合作 方式 目下 而 上 搭建 。 
你 可 以 在 图 6-5 中 看 到 该 结构 。 
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该 构架 有 两 个 层次 。 第 一 个 层次 主要 是 对 话 的 焦点 。 例 如 ， 结 对 程序 员 和 是 否 在 讨论 任务 的 摘 
述 ， 或 试图 理解 代码 ， 或 在 一 起 写 代 码 ， 或 谈论 别 的 东西 ， 比 如 昨 晚 的 足球 比赛 。 第 二 个 层次 分 
析 了 交互 顺序 ” 。 这 里 的 核心 是 交互 模式 。 例 如 ， 如 果 两 个 人 在 对 话 中 都 贡献 了 实质 性 言论 ， 而 
且 发 言 者 在 前 者 的 基础 上 做 出 了 进一步 的 发 言 ， 或 是 证 请 了 前 者 的 发 言 ,， 那么 这 样 的 对 话 被 归 类 

人 们 会 认为 “ 详 述 类 ”对话 的 存在 是 有 益 于 工作 效率 的 。 不 过 ,我 们 疫 有 在 数据 中 找到 相应 
证 据 。 目 前 的 结论 古 化 更 多 的 时 间 来 讨论 任务 接 述 会 减少 解决 整个 任务 所 花 的 时 间 。 这 时 得 出 最 
终结 论 还 为 时 过 早 ， 所 以 你 不 应 该 把 这 个 作为 证 据 ， 而 应 把 它 加 入 实践 中 的 反思 过 程 。 如 何 理 解 
软件 工作 量 预 估 中 的 合作 还 在 进一步 的 探索 中 “。 














6.2.3 ”再 谈 个 性 


提 到 合作 ， 不 得 不 再 次 提 到 个 性 。 例 如 一 些 人 类 学 研究 关注 个 性 问题 与 软件 工程 团队 合作 中 的 
意见 分 上 坡 。 他 们 发 现 分 歧 很 粮 灿 ,但 是 如 果 没 有 争论 的 话 ( 轻 度 的 分 歧 ) 结果 会 更 加 精 灿 ””。 有 
人 和 争论 说 ， 结 对 或 者 团队 中 的 成 员 个 性 过 于 相似 会 导致 缺乏 和 争论。 这 在 Williams 等 人 “和 Walle 与 
Hannay” 的 报告 中 被 实验 证 实 了 。 特 别 是 ， 外 向 性 的 不 同 产生 的 影响 最 大 : 结对 中 的 俩 人 如 果 外 向 
性 的 指数 不 同 ,那么 他 们 的 合作 会 更 深入 (就 是 有 更 多 的 讨论 ), 脏 于 那些 外 向 性 水 平 相似 的 结对 。 


6.24 ”从 更 广 的 角度 看 待 智力 


智商 〈IQ) 高 的 人 不 一 定 擅长 于 计划 或 者 制定 优先 级 ， 比 如 什么 时 候 应 该 计划 ， 什 么 时 候 应 
该 前 进 并 采取 行动 “。 计 划 很 重要 。 我 们 的 初步 调查 结果 显示 ,最 快 的 结对 程序 员 花 了 相对 更 多 
的 时 间 来 了 解 任务 的 摘 述 ， 这 可 以 看 成 是 在 计划 上 伦 了 更 多 时 间 。 有 人 进一步 认为 ， “经典 智 
力 测 验 的 重点 征 处 理 速度 ， 只 是 表明 高 分 数 更 擅长 解答 IQ 测 试题 目 , 但 并 没有 度量 他 们 在 实际 生 
活 中 找 出 问题 最 佳 解决 方案 的 能 

有 人 会 质疑 传统 智力 构建 的 内 容 效 度 不 够 充分 。 基 于 专门 研究 智力 的 认 知 心理 学 家 的 研究 ， 
Robert Sternberg 和 他 的 同事 发 现 智力 应 该 包括 从 经 验 中 学 习 的 能 力 , 运用 元 认 知 过 程 (比如 计划 ) 
来 提高 学 习 的 能 力 ， 以 及 适应 环境 的 能 力 。 同 时 ,不 同文 化 对 智慧 的 理解 不 同 “。 因 此 智力 的 经 
典 建构 可 能 不 够 广泛 。 请 参阅 下 和 面 的 “智力 的 其 他 方面 ”。 

















智力 的 其 他 方面 
Sternberg 的 “智力 三 元 理论 或 者 成 功 智力 理论 ”提出 了 智力 的 三 个 方面 : 分 析 性 ， 
创造 性 和 实践 性 ( 见 图 6-6)。 该 理论 根据 个 人 标准 和 社会 文化 背景 描述 了 智力 竞争 力 。 
成 功 是 所 有 三 个 方面 的 综合 运用 ,并 在 这 三 个 方面 中 利用 自己 的 长 处 ,弥补 自己 的 弱点 。 
该 理论 涵 插 前面 “智力 因素 ”中 的 概念 。 
e 分 析 性 智力 : 智力 与 信息 处 理 内 部 世界 之 间 的 关系 。 这 方面 有 三 个 组 成 部 分 。 
口 元 成 分 
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规划 和 监测 其 他 成 分 使 用 的 高 阶 过 程 。 
口 执行 成 分 
执行 元 成 分 决定 的 低 阶 认 知 过 程 ， 类 日 GMAT 
口 知识 习 得 成 分 
O 在 一 开始 学 习 如 何 解决 问题 的 认 知 过 程 。 
创造 性 智力 : 智力 与 经 验 的 关系 。 这 一 方面 说 明 以 往 的 经 验 和 新 的 经 验 如 何 与 分 析 部 
分 交互 ， 包 括 内 容 如 下 。 
O 处 理 新 事物 的 能 
在 新 的 概念 系统 中 学 习 思 考 的 能 
口 自动 信息 处 理 
AANER. 
。 实践 性 智力 : 智力 与 外 部 世界 的 关系 。 这 包括 : 
O 适应 自身 环境 ; 
O 形成 自身 环境 ; 
口 选择 一 个 不 同 的 环境 。 
还 有 许多 其 他 每 力 模型 ， 见 Sternbengb9 的 报告 。 





创造 性 智力 





图 6-6 ”智力 的 三 元 理论 


根据 Sternberg 的 理论 ， 智 力 充分 体现 在 生存 能 力 和 适应 能 力 上 。 天 应 行为 包括 解决 实际 问题 
的 能 力 , 口头 表达 能 力 和 社会 范 争 力 。 后 者 包括 接受 他 人 的 本 质 ， 承认 错误 以 及 显示 对 厂 义 世界 
的 兴趣 每。 这些 对 协作 来 说 都 古 无 价 的 东西 。 

适应 性 行为 也 是 Gerd Gigerenzer 和 “适应 性 行为 和 认 知 研究 小 组 ”的 信和 条。 当面 对 复杂 的 任务 
上 时， 西方 科学 和 工程 学 科 通 第 教 我 们 如 何 分 析 并 绪 得 所 有 相关 因素 ， 之 后 采取 适当 的 行动 。 然 而 ， 
许多 任务 , 尤其 对 于 没有 明确 定义 的 任务 , 如 软件 工作 量 估算 , 我 们 无 法 得 到 所 有 相关 因素 然后 进 
行 全 面 彻底 的 分 析 。 和 凭借 我 们 投入 的 努力 , 我 们 可 能 认为 得 到 了 很 多 相关 因素 , 但 我 们 也 很 可 能 错 
失 了 更 多 的 因素 。 因 此 ， 有 观点 认为 ， 这 种 分 析 方 法 是 必然 达 不 到 目的 的 。 人 类 已 经 在 复杂 环境 下 
适应 并 生存 了 下 来 ， 靠 的 不 是 彻底 分 析 ， 而 是 剔除 无 关 因素 ， 关 注 少数 的 重点 ” 。 因 此 ， 适 应 
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性 行为 就 是 承认 缺 护 ， 并 选择 相应 的 策略 。 这 也 适用 于 软件 开发 和 软件 工作 量 人 估算， 因为 无 法 事 
先 确定 和 分 析 一 切 。 关 注 儿 个 最 关键 因素 的 做 法 包括 类 比 推理 和 自 上 而 下 的 估算 “|。 


6.3 ”结束 语 


这 本 书 的 读者 应 该 会 喜欢 “反思 型 从 业者 观点 ”是 , 从 业者 反思 他 们 在 日 常 工作 中 的 做 法 ， 
并 制定 更 好 的 方法 来 执行 工作 任务 。 掌 握 从 业 人 员 通 常 的 隐 含 理解， 应 该 是 像 我 们 这 样 学 科 的 主 
要 工作 重点 。 我 必须 提 到 ,我 们 之 前 说 起 的 人 事 经 理 也 声明 ,她 并 不 希望 公司 里 面 的 程序 员 花 太 
多 时 间 反 思 他 们 做 完 的 事情 。 相 反 ， 他 们 只 要 去 执行 他 们 被 要 求 执行 的 任务 就 够 了 。 我 能 肯定 ， 
我 们 中 的 大 多 数 人 ， 包 括 Joel Spolsky， 并 不 喜欢 这 个 观点 , 但 在 时 间 为 导向 的 巨大 压力 下 ,很 容 
易 回复 到 这 种 策略 。 也 就 是 说 ， 因 为 身 陷于 “紧急 且 重 要 ”的 任务 ， 而 牺牲 了 “不 紧急 但 重要 ” 
的 计划 和 开发 任务 1。 

然而 ,按照 我 们 的 观点 , 我 们 给 受 时 间 所 困 的 人 力 资 源 经 理 设 了 一 个 逻辑 陷阱 : 她 之 前 的 智 
商 论点 涉及 GMA 预 测 编程 性 能 ， 但 GMA 首 先 预 测 学 习 能 力 ， 这 就 是 说 ， 她 喜欢 学 习 速 度 快 的 程 
序 员 ,学 习 是 通过 反思 实践 完成 的 , 但 一 旦 她 有 了 程序 员 ， 她 不 希望 他 们 反思 ， 因 此 她 不 希望 他 
们 学 习 。 我 把 这 称 为 不 思考 的 、 被 时 间 所 困 的 人 事 经 理 的 悖 论 。 

事实 上 ， 这 位 人 力 资 源 经 理 并 不 是 完全 不 思考 的 。 她 知道 智力 起 一 定 作 用 。 也 许 她 已 经 阅读 
了 这 章 所 引用 的 一 些 文献 。 但 她 或 许 没有 读 到 智力 有 益 于 获取 知识 ， 而 不 是 预测 已 知 的 技能 。 智 
力 不 仅仅 指 智商 (智商 只 是 智力 的 一 方面 )。 阅 读 科技 文献 时 很 容易 遗失 细节 ， 这 不 会 是 第 一 次 。 
软件 工程 里 有 这 样 一 个 传说 : Royce 在 他 的 文章 中 反对 瀑布 模型 ， 但 业界 未 能 翻 到 下 一 页 ， 在 
那里 他 说 道 , 前 一 页 的 模型 是 不 被 推荐 。 这 样 一 知 半 解 的 例子 在 从 业者 和 研究 者 中 一 定 还 有 很 多 。 
当 在 基于 证 据 做 出 决定 时 ， 请 先 更 全 面 地 了 解 你 的 证 据 。 

让 我 们 回 到 本 章 开始 提出 的 三 个 问题 。 第 一 个 问题 有 关 是 否 可 以 定义 怎样 是 优秀 的 软件 开发 
人 员 。 对 于 软件 开发 的 某 些 任务 (例如 ， 编 程 )， 我 们 可 能 很 快 就 会 得 出 一 个 定义 。 对 于 其 他 任 
务 (例如 ， 软 件 工作 量 估算 ) ， 则 很 难 定义 。 你 也 许 会 反对 说 ， 一 个 优秀 的 工作 量 估算 者 不 就 是 
以 正确 的 信心 指数 准确 可 靠 地 做 出 估算 吗 。 但 在 这 之 前 ,请 记 住 我 们 这 一 章 所 赋予 第 一 个 问题 的 
意义 远 远 不 止 于 此 。 定 义 一 个 出 色 表 现 者 意味 着 把 任务 和 任务 所 需 的 专业 技能 定义 到 如 下 的 程 
度 : 新 手 怎样 才能 成 为 专家 ， 专 家 怎样 才能 成 为 更 好 的 专家 。 

对 第 二 个 问题 的 回答 与 第 一 个 问题 类 似 。 对 于 某 些 任务 ， 我 们 能 度量 专业 技能 和 任务 难度 ， 
但 对 其 他 任务 我 们 还 不 能 这 么 说 ,请 注意 , 我 们 需要 有 效 的 方法 来 确定 一 定 程度 的 专业 技能 , 即 : 
无 需 观察 很 长 一 段 时 间 的 表现 。 因 此 ， 这 包括 预测 未 来 的 表现 。 

本 章 所 涉及 的 两 个 主要 任务 一 一 编程 和 软件 工作 量 预 估 本 质 上 很 不 同 : 一 个 涉及 规划 ， 另 一 
个 涉及 执行 。 而 我 们 对 前 两 个 问题 的 答案 似乎 扩大 了 这 一 鸿沟 。 但 是 仅仅 因为 我 们 开始 对 一 个 任 
务 有 了 解 ， 而 对 另 一 个 任务 没有 了 解 ， 并 不 意味 这 两 个 任务 无 关 。 相 反 ， 人 们 很 自然 地 会 询问 ， 
它们 之 间 的 表现 会 不 会 有 相互 联系 。 

当前 说 来 ， 编 程 技能 、 预 测 的 准确 度 、 完 成 自身 任务 的 可 靠 度 是 正 相关 的 ， 这 与 人 们 通常 认 
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为 的 “即使 是 好 的 程序 员 也 不 能 估算 上 自己 的 工作 量 ” 的 认识 相反 。 如 琳 正 相关 性 被 证 明 是 真实 的 ， 
你 就 可 以 让 你 最 好 的 程序 员 估算 工作 量 ， 并 根据 实际 完成 这 项 工作 的 程序 员 的 水 平 来 校正 预 合 。 
相对 当前 使 用 的 与 技能 无 关 的 补偿 因素 来 说 ,这 征 一 个 巨大 的 进步 。 这 里 使 用 一 个 概念 替代 即 一 
个 概念 的 方法 ,十 一 个 有 趣 的 前 景 。 例 如 , 你 可 以 通过 提高 编程 技能 来 间接 提高 估算 的 准确 度 吗 ? 

第 三 个 同 题 ,如 琳 不 能 可 靠 地 确定 专业 技能 ,是否 应 侧重 于 工具 。 如 来 能 明白 任务 和 所 需 的 
专业 技能 ， 那么 我 们 肯定 应 该 更 多 地 专注 于 专业 技能 。 因 为 大 量 的 研究 表明 ,增加 组 织 机 构 几 个 
百分点 的 专业 技能 ， 就 能 提高 它 的 商业 价值 。 但 显然 ，Glass 的 观点 上 只 有 在 你 知道 如 何 识 别 程序 
员 的 专业 技能 时 才 会 起 效 。 当 你 不 了 解 专业 技能 ， 以 及 不 知道 如 何 发 展 它 时 ,为 一 种 方法 就 古 依 
徘 环境 和 发 展 辅助 环境 的 工具 和 技术 。 然 后 相关 技能 就 变 成 了 对 于 辅助 环境 的 工具 和 技术 的 筝 
握 。 可 能 这 是 把 “定义 不 明 ” 的 任务 (比如 软件 工作 量 估 算 ) 至 少 转换 为 “不 稳定 ”任务 CAI 
做 不 到 “稳定 ”的 话 ) 的 方法 。 
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Mark Guzdial 





这 本 书 的 大 部 分 内 容 都 以 某 种 方式 围绕 着 程序 员 展 开 ， 如 开发 软件 的 最 佳 方 式 、 开 发 软件 的 
成 本 、 什 么 样 的 交流 能 促进 编程 。 但 首要 问题 是 ， 要 成 为 程序 员 就 很 因 难 。 试 图 进入 该 领域 的 人 
少 ， 真 正 进来 的 更 少 。 在 这 一 章 中 ， 我 们 要 问 : 为 什么 学 编程 这 么 难 ? 

我 们 是 否 需 要 在 当前 发 展 更 多 的 程序 员 ? 这 是 一 个 争议 点 。 美 国良 工 统计 局 刚刚 预言 了 对 计 
算 机 专业 人 才 的 巨大 需求 。 根 据 2008 年 11 月 的 报告 “， 从 2006 年 到 2016 年 ， 对 “IT 专业 人 士 ”的 
需求 增长 率 将 是 其 余 旁 动力 的 两 倍 。2009 年 11 月 的 估计 更 新 道 :“ “计算 机 与 数学 ”是 最 快速 增 
长 的 主要 职业 组 中 增长 最 快 的 职业 集群 。” 中 但 什么 是 “IT 专 业 人 士 ”? 是 “计算 机 与 数学 ”的 
职业 吗 ? 基于 许多 新 近 失 业 的 IT 工作 者 的 经 验 , 美国 的 程序 员 也 许 已 经 太 多 了 “1, 特别 是 在 当前 
HZ Gy ee 

虽然 还 不 能 确定 我 们 是 否 需要 更 多 的 程序 员 , 但 很 明确 的 是 , 许多 开始 走 上 编程 之 路 的 人 很 
早 就 失败 了 。 关 于 入 门 级 计算 机 课程 (通常 用 CS1 指 代 ， 根据 一 份 早期 课程 标准 报告 ) 高 挂 科 率 
的 传言 在 文献 和 会 议 的 走廊 交谈 中 非常 普遍 ， 这 样 的 会 议 包 括 美 国 计 算 机 协会 (ACM) 计算 机 
科学 教育 特别 兴趣 小 组 (SIGCSE) 的 研讨 会 。Jens Bennedsen 和 Michael Caspersen 是 第 一 个 试图 
合理 地 找 出 失败 率 的 真实 数据 的 人 一 。 他 们 通过 几 个 计算 机 科学 (CS) 教师 的 邮件 列表 向 全 世界 
的 教员 寻求 数据 。 有 63 所 学 院 提 供 了 他 们 入 门 课程 的 通过 率 , 这 意味 着 这 些 数据 是 自我 选择 和 日 
我 汇报 的 比如 ,结果 实在 太 昌 碎 的 学 校 可 能 选择 不 参与 或 者 说 说 ， 所 以 结果 可 能 是 焉 曲 的 ， 
为 样本 并 不 随机 )。 大 体 上 说 ，30% 的 学 生 在 第 一 门 课 束 会 挂 科 或 者 退 课 ， 专 科学 院 比 综合 大 学 
的 比率 更 高 些 (40% 对 30%)。 因 此 ， 我 们 可 以 大 概 知 道 ， 在 全 世界 所 有 机 构 中 ， 每 三 个 开始 CS1 
课程 的 学 生 就 有 一 个 失败 或 者 放弃 。 这 完 苋 是 为 什么 ? 

Bennedsen 和 Caspersen 的 结果 公布 的 只 是 课程 学 习 的 成 功 或 失败 。 然 而 ，CS1 老 师 的 标准 并 
不 是 成 功 的 唯一 定义 。 许 多 程序 员 从 没有 上 过 任何 课程 ， 但 仍然 很 成 功 。 所 以 ,除了 成 绩 的 证 明 
外 ,我 们 必须 首先 确定 学 生 学习 编 程 确实 很 困难 。 如 条 我 们 可 以 确定 这 个 ， 下 一 个 问题 会 是 “为 
什么 ”。 编 程 是 一 个 非 自 然 的 行为 吗 ”如 果 换 一 种 方式 ， 编 程 是 不 是 会 变 得 更 人 简单 ?编程 如 果 能 
以 另 一 种 方式 教授 ,会 不 会 学 起 来 更 简单 ? 或者, 也 许 我 们 压根 就 不 知道 如 何 衡 量 学 生 对 编程 的 
了 解 情况 。 
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7.1 学 生 学 习 编 程 有 困难 吗 


在 20 世 纪 80 年 代 的 耶鲁 大 学 , Elliot Soloway 在 他 的 Pascal 编 程 课程 中 定期 布置 相同 的 作业 “1; 
写 一 段 代码 ， 重 复读 取 正 整数 ， 直 到 读 入 99999。 在 看 到 99999 之 后 ， 代 码 应 该 输出 
平均 值 。 

这 在 计算 机 教育 研究 的 初期 成 为 了 被 研究 最 多 的 问题 之 一 ， 被 称 为 “降雨 量 问 题  。 在 1983 
年 用 这 个 公式 表达 这 个 问题 的 论文 中 (其 他 的 论文 可 能 探究 其 他 的 公式 )， 耶 鲁 团 队 探 索 了 是 否 
加 一 个 “leave” 语 句 (C 或 Python 中 的 break 语 句 ) 会 提高 学 生 在 这 个 问题 上 的 得 分 。 他 们 把 这 个 
问题 交 给 3 个 小 组 。 

O CS1 第 一 学 期 学 习 了 3/4 的 学 生 ， 已 经 学 习 和 使 用 了 WHILE、REPEAT 和 FOR 语句 。 

O CS2 (第 二 学 期 的 计算 课程 ， 第 见 的 是 数据 结构 课程 ) 已 经 学 习 了 3/4 的 学 生 。 

O 系统 编程 课程 中 大 三 大 四 的 学 生 。 

在 每 个 班级 的 学 生 中 ， 一 半 使 用 传统 的 Pascal 语 言 ， 另 一 半 有 机 会 使 用 添加 了 leave 语 句 的 
Pascal。 在 表 7-1 中 总 结 的 数据 也 许 会 使 那些 已 经 成 功 进入 编程 行业 的 人 感到 震惊 。 只 有 14% 的 入 
门 级 学 生 可 以 用 原始 的 Pascal 解 决 这 个 问题 ? 并 且 30% 最 高 级 的 学 生 也 不 能 解决 ?这 个 研究 多 次 
重复 出 现在 文献 中 (比如 ，Jim Spohrer 和 Lewis Johnson 的 论文 都 研究 了 学 生 在 降雨 量 问题 上 
的 工作 结果 )， 之 后 也 非 正 式 地 重复 了 多 次 ， 令 人 吃惊 的 是 ， 每 次 都 有 相似 的 结果 。 


表 7-1 耶鲁 学 生 在 降雨 量 问 题 上 的 表现 











班 组 使 用 原始 Pascal 的 准确 率 使 用 带 leave 的 Pascal 的 准确 率 
CSI 14% 24% 
CS2 36% 61% 
系统 编程 69% 96% 


这 个 问题 需要 一 个 相对 复杂 的 条 件 控制 循环 。 如 果 输 入 是 负数 ， 和 忽略 它 并 继续 接受 输入 。 如 
有 果 输 入 是 正 数 而 不 是 99999， 把 它 加 入 总 数 并 增加 一 次 计数 。 如 果 输 入 是 99999， 和 忽略 输入 并 人 退出 
循环 。 很 容易 把 负数 或 者 99999 计 入 总 数 而 出 错 。 

这 些 结 琳 来 自 耶 鲁 大 学 。 可 不 可 能 是 耶鲁 大 学 的 编程 教学 水 平 人 很 差 ? 那些 学 生 中 只 有 少数 在 
进入 大 学 前 学 习 了 编程 ， 所 以 无 论 他 们 得 到 了 什么 指导 ， 都 是 从 CS1 课 程 中 来 的 。 许 多 年 来 ， 研 
究 者 一 直 想 知道 如 何 开展 一 项 编程 的 研究 , 能 避免 某 一 所 学 校 可 能 产生 的 误导 所 引起 的 复杂 因素 。 


7.1.1 2001 年 McCracken 工 作 小 组 





在 2001 年 , Mike McCracken “组 织 了 一 个 研究 小 组 , 在 坎特伯雷 肯特 大 学 举办 的 计算 机 科学 
教育 创新 和 技术 (ITICSE) 大 会 上 相聚 。ITICSE 是 一 个 在 欧 汕 举行 的 大 会 ， 吸 引 着 全 世界 各 地 
的 人 前 来 参与 。McCracken 小 组 的 老师 们 想 要 进行 与 他 们 CS1 或 者 CS2 课 程 同 样 的 研究 : 布置 同样 
的 问题 , 给 学 生 90 分 钟 在 纸 上 完 成 任务 。 所 有 学 生 的 数据 都 会 提交 给 大 会 , 并 由 大 会 参与 者 分 析 。 
3 个 国家 的 4 个 机 构 参 加 了 这 第 一 次 “多 机 构 ， 多 国家 ”(MIMN) 的 计算 机 系 学 生成 绩 研 究 。 通 
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过 比较 跨 机 构 跨 国家 的 学 生 ， 人 研究 者 希望 对 学 生 在 第 一 年 能 够 做 什么 有 更 清楚 的 概念 。 

学 生 要 解决 的 问题 是 : 评估 只 含有 数字 、 二 元 运算 (+, —, /, *) 符 或 一 元 负 运 算 符 (~, 
为 了 避免 减 写 的 重 载 ) 的 算数 表达 式 (只 包括 数字 和 符号 )。 一 共有 216 个 学 生 提 交 了 答案 。 评 分 
与 编程 语言 无 关 ， 总 分 110 分 ， 而 平均 分 只 有 22.89 分 (21%)。 学 生 们 在 这 个 问题 上 表现 太 差 了 | 
一 位 老师 其 至 “ 作 雌 "， 他 在 布置 问题 之 前 先 对 学 生 直 接 讲 解 了 表达 式 如 何 评 估 。 那 个 班级 的 表 
现 也 没有 好 到 哪里 去 。 

MecCracken 工 作 小 组 对 他 们 的 数据 做 了 几 次 评 佑 。 他 们 发 现 班级 与 班级 之 间 表 现 相 差 大 殊 。 
他 们 也 看 到 了 许多 计算 机 老师 已 经 注意 到 的 、 一 些 文章 也 试图 解释 的 “ 双 峰 效应 ”的 证 据 。 一 些 
学 生 就 是 能 “ 明 白 ”并 且 表 现 得 很 好 。 更 多 学 生 所 在 的 那个 “ 驳 峰 ” 却 表现 得 差 很 多 。 为 什么 一 
些 学 生 就 是 能 “明白 ”编程 而 为 一 些 不 能 呢 ? 有 人 探究 了 不 同 的 变量 ， 从 过 往 计 算 机 经 验 到 数学 
背景 ,仍然 没 有 找到 对 这 个 结果 的 有 力 解 释 。 











7.1.2 Lister 工 作 小 组 


一 些 学 生 可 能 对 一 位 老师 或 一 种 教授 方式 没有 共鸣 , 但 是 为 什么 不 同 机 构 的 这 么 多 学 生 都 如 
此 差劲 ? 所 有 地 方 的 教学 都 很 差 吗 ? 我 们 高 估 了 学 生 的 能 力 吗 ? 或 者 是 我 们 没有 度量 正确 的 东 
西 吗 ? Raymond Lister 在 2004 年 组 织 了 第 二 次 ITICSE 工 作 小 组 ， 来 探究 这 些 问题 “。 

Lister 小 组 的 想法 是 McCracken 小 组 对 学 生 的 要 求 太 高 了 。 给 他 们 的 问题 需要 对 设计 和 实现 方 
案 的 高 层次 思考 。 而 Lister 小 组 决定 广 重 阅读 和 追踪 代码 的 低层 次 能 力 。 他 们 制作 了 一 个 选择 题 
问卷 (MCQ) 让 学 生 执 行 任 务 ， 如 阅读 代码 并 识别 输出 ， 或 者 识别 代码 段 空白 处 的 正确 代码 。 
问题 针对 数组 操作 。 他 们 邀请 世界 各 地 的 参与 者 给 他 们 的 学 生 同 样 的 问卷 ,并 把 结 来 交 给 ITICSE。 

Lister 小 组 的 结果 稍 好 ， 但 仍然 令 人 失望 。556 个 学 生 的 平均 分 是 60%。 虽 然 这 些 结果 确实 使 
人 和 想到 McCracken 小 组 高 舍 了 学 生 的 能 力 ， 但 是 Lister 和 他 的 小 组 对 他 们 的 问卷 有 着 更 高 的 期 望 。 

McCracken 和 和 Lister 的 工作 告诉 了 研究 者 ， 要 低估 学 生 在 党 一 个 课程 中 对 编程 的 理解 很 困难 。 
很 明显 ， 他们 学 的 比 我 们 知道 的 少 多 了 。 现 在 问题 来 了 , 一些 学 生 在 学 习 ， 而 大 多 数 人 不 在 。 编 
程 中 什么 东西 这 么 困难 ， 以 至 于 大 部 分 学 咎 不 能 简单 上 手 ? 


7.2 人 们 对 编程 的 本 能 理解 是 什么 


语言 学 家 普 遇 认同 ， 人 类 对 语言 的 兴 香 度 很 高 。 我 们 的 大 脑 进化 至 今 ， 能 快速 并 高 效 地 开始 
学 习 新 语言 ， 特 别 是 对 自然 语言 。 然 而 ,编程 是 一 种 对 人 工 语言 的 操纵 ， 古 为 了 一 个 特定 的 、 相 
对 不 目 然 的 目的 而 发 明 的 “确切 地 ”告诉 一 个 非 人 类 的 代理 (电脑 ) 应 该 做 什么 。 也 许 编程 
对 我 们 来 说 不 古 一 个 目 然 的 行为 ， 只 有 少数 人 能 成 功 地 在 这 非 目 然 行 为 上 做 复 洒 有 的 头脑 体操 。 

我 们 应 该 如 何 回答 这 个 问题 呢 ? 可 以 答 试 一 种 类 似 于 Lister 对 McCracken 方 法 的 改进 : 选择 任 
务 的 一 小 部 分 并 专注 于 此 。 编程 需 要 用 非 自 然 语 言 告 诉 机 如 做 什么 。 如 琳 我 们 让 参与 者 用 自然 语 
言 告诉 即 一 个 人 去 完成 未 些 任务 ， 那 会 如 何 ? 参与 者 会 如 何 定义 他 们 的 “程序 ? 如 采 我 们 去 除 
人 工 语言 ， 编 程 会 是 “ 目 然 的 ”或 者 “常识 性 的 ”的 吗 ? 
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L.A. Miller 要 求 他 的 研究 参与 者 创造 指令 让 别人 执行 “。 参 与 者 得 到 了 各 种 文件 (如 员工 、 
工作 和 薪资 信息 ) 和 任务 的 说 明 ， 如 下 所 示 。 


制作 一 份 符合 下 列 标准 之 一 的 员工 列表 : 

(1) 有 技师 头衔 并 且 每 小 时 工资 在 6 美元 以 上 ; 
(2) 未 婚 并 且 每 小 时 工资 在 6 美元 以 下 。 

列表 应 该 根据 员工 姓名 组 织 起 来 。 


Miller 弄 清楚 了 对 于 参与 者 来 说 什么 是 复杂 的 和 什么 是 容易 的 。 首 先 ， 他 的 研究 对 象 都 完成 
了 任务 。 并 没有 像 编程 课 中 发 生 的 那样 ,三 分 之 一 的 人 放弃 或 失败 。 为 别人 指定 程序 的 这 项 基本 
挑战 看 来 并 不 成 问题 。 

Millier 问 题 的 自然 语言 解决 方案 和 之 前 研究 者 研究 的 编程 问题 有 一 个 关键 的 不 同 点 : 解决 方 
案 的 结构 。Miller 研 究 对 象 没 有 定义 迭代 ， 而 是 设 定 了 操作 。 举 例 说 来 ， 他 们 没有 说 “找到 每 个 
文件 夹 查看 姓氏 。 如 果 以 G 开 头 ……” 而 是 说 关于 如 何 做 事 “ 对 所 有 姓氏 以 G 开 头 的 人 ……” 令 
Miller 感 到 惊讶 的 是 : 没有 一 个 人 对 他 们 的 循环 设 定 了 结束 条 件 。 一 些 人 说 了 类 似 于 正 的 可 测试 
条 件 ， 但 没 人 用 ELSE。 单 从 这 个 结果 就 可 以 看 出 ， 定 义 一 个 对 初学 者 更 自然 的 编程 语言 是 可 能 
的 。 

Miller 另 外 做 了 一 个 实验 ， 他 把 第 一 个 实验 中 有 含糊 循环 的 指令 给 其 他 参与 者 。 没 有 人 对 此 
指令 有 任何 的 问题 。 很 明显 ， 当 你 处 理 完 数据 后 就 会 停 下 来 。 研究 对 象 处 理 完 了 数据 组 ， 却 没有 
增加 任何 索引 。 

John Pane 在 20 世 纪 90 年 代 末 和 21 世 纪 初 继续 了 这 项 探索 ”1。 Pane 对 创造 一 种 编程 语言 非常 感 
兴趣 ， 能 更 贴近 于 人 们 对 他 人 描述 流程 的 “自然 ”方式 。 他 复制 了 Miller 的 实验 ， 但 是 任务 和 输 
入 不 同 。 他 担心 Miller 提 供 “ 文 件 ” 并 要 求 “ 列 表 ” 的 方式 可 能 诱导 了 参与 者 。 取 而 代 之 ，Pane 
向 研究 对 象 展示 了 图 片 和 游戏 片段 ， 然 后 询问 他 们 会 如 何 告诉 电脑 从 而 使 那些 事情 发 生 。 比 如 ， 
“ 写 一 段 话 ， 总 结 我 (作为 电脑 ) 应 该 如 何 针 对 其 他 事物 的 存在 或 空缺 而 移动 “ 吃 豆 人 ?”。” 

和 Miller 一 样 ，Pane 发 现 人 们 不 会 用 循环 。 他 从 编程 范式 的 角度 进一步 辨别 了 指令 种 类 。 他 
发 现 有 很 多 人 使 用 了 约束 (“这 个 东西 总 是 做 那个 事情 ”)、 事 件 驱 动 编程 (“ 当 “ 吃 豆 人 ” 吃 到 所 
有 豆 时 ， 他 会 升级 到 下 一 个 级 别 ”) 和 命令 编程 。 没 有 人 哪怕 一 次 提 到 “对 人 象 ”。 他 们 说 到 游戏 中 
实体 的 特征 和 行为 ,但 不 对 那些 实体 分 组 (如 , 归 入 “类 ”)。 没有 人 从 实体 本 身 的 视角 谈论 行为 ， 
所 有 事情 都 是 从 玩家 或 者 程序 员 的 角度 出 发 的 。 

基于 Miller 和 Pane 的 实验 ， 我 们 也 许 能 声称 ， 人 有 能 力 对 另 一 个 代理 指定 任务 ,但 是 我 们 当 
前 的 编程 语言 不 允许 人 们 以 他 们 思考 任务 的 方式 来 编程 。 如 果 编 程 语言 做 得 更 自然 , 大 部 分 学 生 
是 不 是 就 能 够 编程 了 ? 人 们 能 用 更 自然 的 语言 解决 牵涉 重要 算法 的 复杂 问题 吗 ? 更 自然 的 语言 
是 不 是 对 新 手 的 任务 和 专业 人 员 的 任务 均 有 益处 ? 如 果 不 是 ，CS 的 学 生 们 是 不 是 仍然 需要 在 某 
个 时 间 点 开始 学 习 专 业 语 言 ? 

一 批 自 称 为 “常识 计算 小 组 ”的 研究 者 已 经 问 过 了 这 些 问题 中 的 一 部 分 。 他 们 要 求 CS1 的 预 
备 学 生 在 学 习 编程 语言 之 前 用 自然 语言 解决 重要 的 算法 任务 ， 比 如 排序 或 并 行进 程 。 他 们 发 现 研 
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究 对 象 在 这 些 任务 上 的 成 功率 惊人 。 
在 一 项 研究 中 “， 他 们 要 求学 生 为 影院 创造 一 套 流程 ， 该 影院 决定 使 用 两 个 票务 销售 商 。 
假设 我 们 通过 电话 用 以 下 方式 销售 音乐 会 门票 : 当 一 位 顾客 打 入 电话 要 求 n 个 座位 
时 ， 销售 者 第 1 步 找到 1 个 最 佳 空余 座位 ， 第 2 步 把 这 些 座位 标记 为 有 人 ， 第 3 步 处 理 顾客 
的 付费 选项 (如 ,得 到 一 个 信用 目 或 者 借 记 目的 卡号 ,或 者 把 昧 和 寄 给 预订 售 货 窗口 自 取 ) 。 
假设 有 不 止 一 个 销售 电话 同时 工作 。 我 们 可 以 预见 什么 问题 ? 应 该 如 何 避免 这 些 
问题 ? 


来 目 5 个 机 构 的 约 66 个 参与 者 试图 解决 这 个 问题 ， 成 功率 尺 人 1 如 表 7-2 所 示 ， 儿 乎 所 有 的 学 
生 都 找 出 了 问题 真正 的 难点 ， 其 中 71% 提 出 了 可 工作 的 解决 方案 。 大 部 分 方案 效率 不 高 ， 因 为 涉 
及 一 个 集中 仲裁 医 ， 所 以 这 些 学 生 仍然 需要 学 习 很 多 东西 。 然 而 ， 他 们 能 解决 并 行 处 理 问 题 的 这 
一 事实 , 表明 了 阻碍 学 生 学 会 编程 的 问题 可 能 更 多 地 出 在 工具 上 。 学 生 的 计算 思维 可 能 比 我 们 想 
象 的 更 强 。 

















表 7-2 ”学生 识 别 出 的 问题 数 和 解决 数 (n=66) ， 摘 自 参考 文献 [16] 


成 ”就 学 生 完成 率 
问题 识别 
© 一 张 标 不 止 卖 了 一 次 97% 
。 其 他 41% 
为 并 发 问题 提供 “合理 的 ”解决 方案 71% 


7.3 通过 可 视 化 编程 来 优化 工具 


如 何 优 化 工具 ? 一 个 明显 的 答案 是 转移 至 更 可 视 的 图 标 系统 。 自从 David Smith 基 于 图 标的 编 
程 语言 Pygmalion 的 出 现 ” ， 理 论 上 就 一 直 认 为 可 视 化 思维 对 学 生 更 容易 。 当 然 也 有 很 多 研究 表 
明 可 视 化 大 体 上 能 帮助 学 生 学 习 计 算 机 1， 但 谨慎 的 研究 相对 较 少 。 

之 后 ，Thomas Green 和 Marian Petre 在 类 数据 流 编 程 语言 和 文本 编程 语言 之 间 , 做 了 一 个 针尖 
对 麦 芒 的 比较 他们 用 两 种 可 视 化 语言 创造 了 两 个 程序 , 这 两 种 语言 在 之 前 的 研究 中 被 证 实 工 
作 民 好。 他们 也 创造 了 一 个 文本 语言 程序 , 该 语言 同样 测试 良好 。 研究 者 在 短 时 间 内 向 研究 对 象 
展示 一 段 可 视 化 程序 或 者 文本 程序 ， 然 后 问 一 些 关 于 程序 的 问题 (如 , 被 展示 的 输入 数据 和 输出 
结果 )。 理 解 图 形 化 语言 总 是 花费 更 多 的 时 间 。 研 究 对 象 有 多 少 可 视 化 或 文本 语言 的 经 验 ， 有 哪 
种 可 视 化 语言 的 经 验 ， 这 些 都 没有 关系 。 研 究 对 象 理解 可 视 化 语言 总 比 理解 文本 语言 更 慢 。 

Green 和 Petre 基 于 这 项 研究 的 变种 发 布 了 若干 篇 文章 "M1, 但 是 真正 的 试验 来 自 于 Tom Moher 
和 他 的 同事 们 中 ,他 们 为 了 支持 可 视 化 语言 而 暗中 作 次 。Tom 和 他 手下 的 研究 生 们 使 用 一 种 可 视 
化 图 标 系统 来 教导 高 中 学 生 编 程 ， 叫 作 Petri Nets。 他 得 到 了 一 份 Green 和 Petre 的 材料 副本 ， 并 创 
造 了 一 个 只 用 Petri Nets 作 为 可 视 化 语言 的 版 本 。 然 后 Tom 把 他 自己 和 他 的 学 生 们 作为 研究 对 象 重 
新 运行 了 这 项 研究 。 使 人 吃惊 的 是 ， 文 本 语言 再 一 次 被 证 实 更 容易 理解 ， 在 每 个 条 件 下 都 如 此 。 
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我 们 对 可 视 化 语言 的 直觉 是 错误 的 吗 ? 可 视 化 是 否 实际 上 降低 了 人 们 对 软件 的 理解 力 ? 那 
Naps 他 们 谈 到 的 那些 研究 又 算 什 么 ”? 他 们 错 了 吗 ? 

有 一 个 对 比 多 项 研究 的 标准 方法 ， 叫 做 元 研究 。BarbaraKitchenham 在 本 书 的 第 3 章 描 述 了 这 
一 程序 。Chris Hundhausen, Sarah Douglas 和 John Stasko 对 算法 可 视 化 的 研究 做 了 同样 的 分 析 王 。 
他 们 发 现 确 实 有 许多 人 研究 表明 算法 可 视 化 对 学 生 有 极 大 的 好 处 。 但 是 许多 研究 并 没有 重大 结果 。 
即使 有 重大 结果 ， 也 没有 明显 地 展示 算法 可 视 化 是 如 何 起 作用 的 (图 7-1)。Hundhausen 和 他 的 同 
事 们 发 现 如 何 使 用 可 视 化 非常 重要 。 例如, 在 讲课 演示 中 使 用 可 视 化 对 学 生 学 习 的 影响 其 微 。 但 
如 果 让 学 生 构 造 自 己 的 可 视 化 工具 ， 就 会 对 学 生 的 学 习 产 生 巨 大 的 影响 。 


1 (4%) 








2(8%) 






Meee. 
10 (42%) | pera 


重大 结果 但 算法 可 视 
化 贡献 不 明 


11(46%) 


[错误 方向 的 重大 结果 





图 7-1 Hundhausen, Douglas 和 Stasko 的 论文 对 的 24 个 研究 报告 的 总 结 号 


一 些 研究 只 改变 了 可 视 化 的 使 用 方法 ， 同 时 保持 了 其 他 各 个 变量 不 变 【〈 例 如 班级 的 类 型 、 学 
生 的 类 型 、 教 师 、 主 题 等 )。 虽 然 Hundhausen 和 他 的 同事 在 分 析 了 24 个 研究 后 ， 对 可 视 化 使 用 方 
法 的 重要 性 产生 了 怀疑 ， 但 是 验证 猜疑 与 乙 并 不 相同 。 我 们 从 教学 研究 中 学 到 的 一 件 事 是 ， 预 测 
输出 其 实 非常 困难 。 人 并 不 像 导 弹 发 射 或 鸡尾酒 调配 那样 可 预测 。 事 实 上 ,我 们 需要 测试 怀疑 和 
假设 ， 有 时 需要 在 不 同情 况 下 反复 测试 ， 直 到 我 们 对 测试 结果 信服 。 


7A ”融入 语 境 后 的 改变 


目前 我 们 知道 的 是 , 开始 学 习 计 算 机 的 学 生 所 学 到 的 设计 和 编码 比 我 们 所 预期 的 少 得 多 。 并 
A, 第 一 门 课 的 挂 科 率 非 第 高 。 我 们 发 现 ， 从 文本 转 至 可 视 化 不 一 定 能 得 到 更 好 的 结果 。 这 表明 ， 
有 其 他 变量 发 挥 了 作用 。 之 前 的 章节 探索 了 可 视 化 使 用 方法 的 不 同 可 能 是 一 个 变量 。 我 们 应 该 稳 
控 哪 些 其 他 变量 来 提高 学 生 的 学 习 成 功率 呢 ? 

1999 年 ,乔治 亚 理 工学 院 决定 要 求 所 有 的 本 科 生 参加 计算 机 入 门 课 程 。 在 开始 的 前 几 年 ， 只 
有 一 门 课 满 足 了 这 一 需求 。 这 门 课 的 总 体 通过 率 为 78% ,参照 Bennedsen 和 Caspersen 的 分 析 ”， 这 
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已 经 很 好 了 。 然 而 , 这 个 数字 分 解 来 看 并 不 如 意 。 文 科 、 建筑 、 管理 学 院 学 生 的 通过 率 不 到 5$0%- 。 
女生 的 挂 科 率 几 乎 是 男生 的 两 倍 。 这 是 一 门面 对 所 有 学 生 的 课程 , 但 是 大 多 数 工 科 专 业 的 男生 都 
通过 了 ， 这 突出 了 计算 机 教学 的 普 志 问题 。 

2003 年 ， 我 们 开始 了 一 项 试验 ， 对 那些 班级 的 学 生 教 授 一 种 不 同 的 入 门 课程 ， 将 媒体 操作 
作为 课程 背景 "。 本 质 上 来 说 ， 学 后 与 其 他 计算 机 科学 入 门 课 程 一 样 学 习 编程 。 事 实 上 ， 我 们 
努力 涵盖 当前 ACM 和 IEEE 标 准 …“ 所 推荐 的 所 有 主题 。 然 而 , 所 有 课本 上 的 例子 , 授课 中 的 代 
码 实 例 ， 以 及 课 后 作业 ， 都 要 求学 生 把 数字 媒体 作为 这 些 程序 中 的 操作 数据 。 比 如 ， 学 生 通 过 
把 一 张 图 片 中 所 有 的 像素 都 转 灰 ， 学 习 如 何 对 数组 的 元 素 进 行 碗 代 ; 通过 连接 声音 缓存 做 数字 
接合 ， 来 代替 连接 字符 串 ， 通 过 去 除 红眼 而 不 影响 图 片 中 别 的 红色 区 域 的 操作 ， 来 学 习 对 数组 
子 区 域 的 迭代 。 

这 次 试验 得 到 了 引 人 了 瞩目 的 积极 反响 。 学 咎 认为 新 的 课程 与 生活 更 相关 且 更 具 信服 力 。 特 别 
是 女生 的 合格 率 赶 超 了 男生 (但 是 没有 任何 统计 意义 ) ”。 接 下 来 三 年 的 平均 通过 率 上 升 至 85%。 
而 且 对 那些 之 前 通过 率 小 于 5$0% 的 专业 也 同样 有 效 ”。 

听 起 来 像 是 一 个 巨大 的 成 功 , 但 是 这 些 论文 究竟 说 了 什么 ? 新 方法 是 所 知 的 唯一 改变 吗 ? 也 
许 那 些 学 校 突 然 开 始 接受 更 聪明 的 学 生 。 也 许 乔 治 亚 理 工学 院 雇 人 了 一 个 有 魅力 的 新 教师 ,学 生 
因为 为 他 倾倒 而 开始 关心 课程 内 容 。 社会 学 研究 者 把 这 些 阻止 我 们 从 研究 中 断言 我 们 所 希望 的 结 
论 的 因素 称 为 有 效 性 的 威胁 "。 为 了 捍卫 研究 的 价值 ， 我 们 可 以 声明 ， 文 章 ” 包括 了 不 同 讲师 的 
多 个 学 期 ， 涵 盖 了 3 年 的 有 价值 结果 ， 学 生 不 太 可 能 在 突然 之 间 变 得 非常 不 同 。 

即使 我 们 有 信心 做 出 结论 说 , 乔治 亚 理工 学 院 的 成 功 是 引入 媒体 计算 的 结果 , 与 其 他 关于 学 
生 和 教学 的 因素 物 无 关 , 我 们 也 应 该 思考 我 们 可 以 断言 什么 。 乔 治 亚 理 工学 院 是 一 所 很 好 的 学 校 。 
他 们 能 吸引 聪明 的 学 生 , 也 能 雇佣 并 留 住 好 老师 。 如 果 你 的 学 校 引 入 媒体 计算 作为 计算 机 入 门 课 
程 ， 能 成 功 吗 ? 

第 一 次 尝试 在 另 一 类 学 校 做 媒体 计算 的 是 乔治 亚 州 盖 斯 威 尔 州立 大 学 的 Charles Fowler, 3 
斯 威 尔 州立 大 学 是 一 所 两 年 制 (没有 本 科 生 和 研究 生 ) 公立 学 校 。 研究 结果 在 同一 篇 论文 "中 做 
了 汇报 。Fowler 也 在 他 的 学 生 中 发 现 了 成 功率 的 急剧 提升 。Fowler 的 学 生 的 跨度 从 计算 机 科学 到 
护理 学 院 。 然 而 ,乔治亚 理工 学 院 和 盖 斯 威 尔 大 学 都 是 白人 学 生 居 多 。 这 种 方法 对 其 他 种 族 的 学 
生 也 适用 吗 ? 

在 伊利 诺 伊 大 学 芝加哥 分 校 (UIC) Pat Troy 和 Bob Sloan 在 他 们 的 “CS 0.5” 课 程 中 引入 了 
媒体 计算 。 他 们 的 课程 是 为 想 学 习 计算 机 专业 ， 但 没有 编程 基础 的 学 生 准 备 的 。CS 0.5 是 为 了 
他 们 的 第 一 门 课 程 (CS1) 做 准备 。 在 多 个 学 期 中 ， 这 些 学 生 的 合格 率 也 得 到 了 提升 。UIC 的 学 
生 包含 了 更 多 种 族 ， 大 部 分 学 生 都 属于 少数 族 毅 。 

现在 ， 你 确信 应 该 对 学 生 使 用 媒体 计算 了 吗 ? 你 也 许 会 争辩 说 ， 这 些 仍然 是 不 寻 负 案例 。 乔 
冶 亚 理工 和 盖 斯 威 尔 研究 的 是 非 主 修学 生 ( 盖 斯 威 尔 也 有 主 修学 生 )。 虽 然 Troy 和 Sloan 处 理 了 想 
要 主 修 计算 机 科学 的 学 生 ， 但 他 们 的 课程 并 不 是 针对 主 修 计 算 机 科学 本 科 生 的 普通 入 门 课 程 。 
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Beth Simon 和 她 在 加 州 大 学 圣地 亚 哥 分 校 (UCSD) 的 同事 们 在 两 年 前 开始 使 用 媒体 计算 作 
为 CS 主 修学 生 的 主要 入 门 课程 (“CS1”)  。 更 多 的 学 生 通 过 了 新 课程 。 更 重要 的 是 ， 上 过 媒体 
计算 的 学 生 在 媒体 计算 后 的 第 二 门 课 程 中 ， 也 比 传统 CS1 课 程 的 学 生 表现 得 更 好 。 

确信 了 吗 ? 媒体 计算 是 一 次 灌 复 扣 杀 吗 ? 所 有 人 都 应 该 使 用 媒体 计算 嘛 ? 虽然 我 的 出 版 商 
希望 你 们 相信 这 个 “二 二 ， 但 是 这 些 研究 并 没有 清楚 地 证 实 它 。 

首先 , 我 没有 声称 学 生 在 媒体 计算 中 学 到 了 等 量 的 东西 。 如 果 有 任何 人 告诉 你 ,学 生 用 他 们 
的 方法 学 到 了 与 其 他 方法 等 量 的 东西 , 请 保持 强烈 怀疑 ， 因为 我 们 目前 对 计算 机 入 门 课程 的 学 习 
并 没有 可 徘 并 有 效 的 度量 。Allison Tew 在 2005 年 第 一 个 试图 回答 学 生 是 否 在 不 同 的 CS1 课 程 中 学 
习 了 同样 的 东西 中 1 中。 她 开发 了 两 套 选 择 题 测试 作 比 较 , 每 套 针 对 一 种 CS1 语 言 。 她 想 让 它们 成 
为 “ 同 构 的 ”: 一 个 评估 特定 概念 的 问题 (如 ， 对 数组 的 迭代 ) 本 质 上 对 所 有 的 测试 和 语言 是 相 
同 的 。 她 把 这 套 测 试用 在 第 二 门 CS 课程 (CS2) 之 前 和 之 后 ， 从 而 度量 学 生 学 习 CS1 课 程 的 差异 。 
Tew 发 现 ， 学 生 确 实在 他 们 的 CS1 课 程 中 学 到 了 不 同 的 东西 (由 CS2 之 前 的 测试 度量 来 看 )， 但 是 
这 些 不 同 在 CS2 课 程 结束 时 消失 了 。 这 是 一 个 重大 的 发 现 ， 表 明 CS1 的 区 别 对 未 来 的 成 功 并 不 那 
么 重要 。 但 在 以 后 的 尝试 中 ， 她 再 也 没有 找到 相同 的 结果 。 

怎么 会 这 样 ? 一 个 可 能 性 是 她 的 测试 不 完全 相同 。 学 生 可 能 对 之 有 不 同 的 理解 。 这 些 测 试 
所 度量 的 可 能 不 完全 是 她 想 测 试 的 那 种 学 习 。 比 如 ， 一 些 选 择 题 的 答案 可 以 被 猜测 ， 因 为 错误 
的 选择 完全 不 实际 以 至 于 学 生 可 以 在 不 知道 正确 答案 的 情况 下 排除 它们 。 一 个 好 的 测量 学 习 的 
测试 应 该 是 可 靠 并 有 效 的 。 换 句 话 说 ， 它 度量 正确 的 事情 ， 而 且 所 有 学 生 在 所 有 时 间 都 对 它 有 
相同 的 理解 。 

在 写 这 篇 文章 时 ， 还 没有 与 语言 无 关 地 、 可 徘 并 有 效 地 对 CS1 学 习 的 度量 。Tew 正 在 测试 一 
个 度量 。 但 是 直到 它 存在 之 前 ， 还 不 可 能 确定 学 和 牛 是 否 在 不 同 的 方法 下 学 到 了 同样 的 东西 。 学 生 
在 媒体 计算 中 的 成 功率 更 高 ， 这 很 好 。UCSD 的 学 生 在 第 二 门 课 中 也 学 得 更 好 ， 这 也 很 好 。 但 是 
我 们 真 的 不 能 断定 学 生 学 到 了 同样 的 东西 。 

其 次 ， 即 使 乔治 亚 理 工 、 盖 斯 威 尔 、UIC 和 UCSD 都 能 证 明 学 生 在 入 门 课 程 中 学 习 了 等 量 的 
知识 ， 那 又 能 证 明 什 么 ? 课程 对 所 有 人 都 适用 ? 不 论 “ 传 统 ” 课 程 如 何 非凡 或 成 功 ， 它 都 比 “ 传 
统 ” 课 程 要 好 ? 无 论 学 生 多 么 准备 不 足 或 者 不 感 兴趣 ， 它 对 所 有 学 生 都 适用 ? 也 无 论 老师 教 得 多 
差 ? 那 当 然 很 元 唐 。 我 们 总 能 想象 出 事情 出 错 的 情况 。 

总 的 说 来 ， 对 课程 的 改进 方法 为 我 们 提供 了 处 方 性 模式 ， 但 不 提供 预言 性 的 理论 。 媒 体 计 算 
研究 加 我 们 展示 了 证 据 ， 说 明 对 于 不 同 种 类 的 的 学 生 和 老师 ， 入 门 课程 的 通过 率 都 可 以 被 提高 ， 
但 不 意味 着 一 定 会 提高 。 能 承诺 改进 的 就 是 处 方 。 它 不 是 预言 性 的 理论 一 一 可 以 预计 改善 ， 因 为 
如 果 不 知道 是 否 有 更 多 还 未 在 学 生 身 上 验证 过 的 变量 , 就 不 能 预计 改善 。 它 也 不 可 能 成 为 预言 性 
的 ， 因 为 我 们 不 能 说 不 使 用 媒体 计算 就 保证 会 失败 。 


7.5 总 结 : 一 个 新 兴 的 领域 


计算 教学 研究 ， 作 为 一 个 研究 的 领域 ,仍然 是 一 个 新 兴 的 学 科 [5]。 我 们 最 近 才 意识 到 计算 教 
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学 的 重要 性 以 及 支持 计算 教育 的 需要 。 支 持 计算 教师 的 ACM 组 织 一 一 计算 机 科学 教师 联盟 
(CSTA) 一 “在 2005 年 才 成 立 。 作 为 对 比 ， 全 国 数学 教师 委员 会 在 1920 年 就 成 立 了 。 





我 们 大 多 数 的 研究 更 多 地 指 加 人们 学 悦 编 程 有 多 复杂 。 BET A SAY A RR] 


恢 和 可， 即使 没有 受过 计算 机 培训 的 学 生 也 已 经 能 用 算法 思 竹 。 然 而 ， 开 发 这 种 技能 到 一 种 程度 ， 
从 而 可 以 用 机 三 的 语言 给 机 右 下 指令 , 比 我 们 期 符 的 要 慢 很 多 。 我 们 可 以 帮助 学 生 走 过 这 一 过 程 ， 
但 我 们 仍然 没有 有 效 的 方法 度量 他 们 所 学 的 多 少 。 











我 们 真正 在 这 一 领域 需要 的 是 预言 性 理论 , 基于 人 们 如 何 真正 建立 对 计算 的 理解 的 模型 。 在 


这 些 理论 之 上 , 我 们 可 以 构造 我 们 有 信心 的 课程 。ACM 的 国际 计算 教育 研究 研讨 会 至 今 只 有 5 多 ， 
参 会 人 数 从 未 超过 100 人 。 我 们 只 有 很 少 的 工作 者 ， 他 们 才刚 刚 开始 一 项 艰巨 的 任务 。 我 们 对 理 
解 为 什么 学 生 学 习 编 程 这 么 困难 只 迈 出 了 第 一 步 。 
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复杂 度 存 在 于 软件 生命 周期 的 每 个 环节 : 需求、 分析、 设计， 当然 还 有 实现 。 一 般 来 说 ， 开 
发 人 员 都 不 希望 软件 过 于 复杂 ， 因 为 这 会 让 软件 难于 阅读 和 理解 ， 也 就 更 难 修改 。 此 外 ， 高 复杂 
度 也 被 视 为 造成 故障 的 原因 。 要 想 测 量 复杂 度 的 话 ， 在 软件 项 目的 所 有 产 出 物 之 中 , 源 代码 最 容 
易 入 手 。 不 过 ， 在 几 十 年 的 软件 研究 之 后 ， 人 们 也 设 能 就 如 何 判 断 革 段 代码 的 复杂 度 形成 共识 。 
甚至 对 比 两 段 用 不 同 的 编程 语言 编写 的 代码 并 指出 哪 段 更 复杂 也 很 困难 。 由 于 没有 一 个 统一 的 解 
决 方案 ， 所 以 现在 软件 复杂 度 指标 展现 出 了 百花 齐 放 的 景象 。 有 没有 人 研究 告诉 我 们 如 何 来 根据 实 
际 情况 选择 最 佳 的 指标 ?这 些 指标 是 不 是 真 的 比 人 简单 的 源 代码 指标 (如 源 代码 行 数 , lines of code, 
下 称 LOC) 更 好 ? 

在 这 一 章 中 , 我 们 将 利用 大 量 开源 软件 来 研究 不 同 的 规模 和 复杂 度 指标 之 间 的 关系 。 为 了 避 
免 太 多 的 属性 和 指标 让 人 看 花 眼 ， 我 们 只 关注 一 种 编程 语言 一 一 C， 一 种 软件 开发 的 经 典 语 言 ， 
并 且 直 到 现在 仍然 是 最 流行 的 编程 语言 之 一 。 我 们 对 大 约 30 万 个 文件 进行 了 指标 测量 , 这 些 指 标 
包括 了 从 最 简单 和 最 常见 的 《LOC) 简单 指标 到 非常 复杂 的 语法 指标 。 这 样 ， 我 们 知道 了 从 统计 
学 的 角度 来 看 哪些 指标 是 相互 独立 的 , 换 名 话说, 就 是 传统 的 复杂 度 指 标 与 简单 的 LOC 指 标 相 比 ， 
到 底 能 不 能 提供 更 多 信息 。 


8.1 对 软件 的 调查 


这 个 研究 的 第 一 步 古 选择 具有 代表 性 的 软件 样本 , 就 像 社会 科学 中 的 问卷 调查 那样 。 对 于 已 
知 的 对 象 总 体 来 说 , 使 用 统计 方法 我 们 将 可 以 从 已 知 对 象 总 体 中 提取 出 最 小 的 样本 量 , 而 这 个 样 
本 量 可 以 让 我 们 在 一 定 的 不 确定 性 下 得 出 结论 。 淮 例 来 说 , 在 写 这 篇 文革 的 时 候 ， 美国 的 人 口 大 
约 是 3 亿 人 ,那么 只 要 有 足够 大 的 样本 量 (比如 3 万 人 )， 那 么 我 们 就 可 以 通过 “出 口 调查 ”( 即 在 
投票 站 门口 对 选民 进行 民意 调查 以 大 致 估计 选举 走 癌 ) 的 方式 准确 的 预测 整个 选举 的 结 末 。 

要 把 这 种 方法 运用 到 软件 工程 中 还 面临 着 一 个 问题 ， 那 就 是 我 们 不 知道 全 世界 软件 的 总 数 
































8.2 计算 源 代码 的 指标 93 


E, 这 也 意味 着 我 们 无 法 确定 一 个 可 以 在 给 定 不 确定 性 下 解决 我 们 的 疑问 的 最 小 样本 量 ,， 所 以 使 
用 传统 的 “调查 方法 ”来 调查 所 有 的 软件 就 不 可 行 了 。 

虽然 我 们 无 法 确定 世界 上 有 多 少 软件 , 但 是 至 少 有 一 部 分 软件 是 公开 的 , 这 些 软件 可 以 用 于 
研究 用 途 ， 并 且 开 发 软件 的 人 们 愿意 和 其 他 人 共享 源 代码 ， 它 们 就 是 开源 软件 。 当 然 ， 从 理论 上 
讲 ， 如 果 我 们 把 统计 对 象 总 体 限制 在 这 类 软件 中 ， 那 么 统计 的 结论 就 只 适用 于 这 类 软件 。 不 过 ， 
说 到 底 软 件 开 源 还 是 不 开源 ,区 别 也 只 是 许可 的 不 同 而 已 ,虽然 开源 软件 通常 都 遵循 某 些 实践 (如 
由 社区 主导 开发 、 开 放 源 代码 等 )， 但 是 其 实 又 各 有 不 同 ， 有 的 开源 项 目 纯粹 由 社区 主导 开发 ， 
而 有 的 则 仍然 受到 公司 的 严密 控制 。 开源 软件 唯一 鸭 共同 之 处 古 它 们 的 许可 协议 , 这 些 协 议 使 得 
公众 可 以 获取 它们 的 源 代码 。 综 上 所 述 ， 我 们 可 以 假定 : 好 的 复杂 度 指标 可 以 来 源 于 开源 软件 ， 
它 的 应 用 汇 围 与 开源 与 否 无 关 。 

开源 软件 还 具备 了 其 他 一 些 有 利 研 究 的 特性 。 开源 软 件 的 储存 库 对 研究 人 员 来 说 通常 是 完全 
公开 的 。 软 件 储存 库 中 包括 了 所 有 软件 项 目的 产 出 物 ， 包括 源 人 代码、 版 本 控制 系统 、 问 题 跟 踪 系 
统 以 及 邮件 列表 档 策 等 , 不 但 如 此 ， 库 中 还 保存 了 它们 的 所 有 历史 版 本 。 任 何人 只 要 感 兴趣 都 可 
以 访问 这 些 信息 。 也 就 是 说 ,开源 软件 不 但 提供 了 大 量 的 代码 ， 让 我 们 研究 的 样本 量 大 小 没有 限 
制 ， 还 让 我 们 的 研究 可 复查 、 可 验证 ， 而 这 些 都 是 实证 研究 的 基本 要 求 ， 有 了 它们 ,人 研究 的 结果 
才 值 得 信赖 。 

不 过 , 在 利用 开源 软件 的 过 程 中 ,还 是 有 各 种 危险 和 陷阱 。 由 于 各 个 开源 软件 之 间 的 差别 较 
大 ， 所 以 很 难 从 大 量 项 目 ( 即 样本 ) 中 获得 数据 。 项 目 经 常 使 用 不 同 软 件 库 ， 即 便 使 用 了 同 种 软 
件 库 用 于 管理 软件 库 的 工具 也 不 尽 相同 ,而 这 些 软件 库 又 稍稍 分 散在 不 同 的 地 点 。 有 这 样 一 些 项 
目 ， 如 FLOSSMetrics (http://flossmetrics.org) 和 FLOSSMole (http://flossmole.org) ， 它 们 提供 了 
一 些 目 录 数 据 库 , 其 中 包括 了 开源 软件 的 各 类 指标 和 信息 , 这 从 一 定 程度 上 缓解 了 在 对 开源 软件 
进行 数据 挖掘 的 时 候 出 现 的 差异 性 问题 。 另 一 方面 , 开源 软件 社区 .自己 也 用 发 行 版 的 方式 部 分 解 
决 了 这 个 问题 ， 比 如 著名 的 Ubuntu 和 Debian 发 行 版 。 发 行 版 从 各 个 开源 项 目 中 搜集 代码 ， 对 其 进 
行 修 改 以 便 和 发 行 版 中 的 其 他 软件 相互 配合 ， 并 统一 发 布 为 编译 好 的 二 进 制 文件 或 者 源 代码 包 。 
这 些 包 都 被 标记 上 了 元 信息 ,这样 他 们 就 能 对 它们 进行 分 类 或 者 下 载 它 们 所 依赖 的 其 他 软件 。 有 
的 发 行 版 的 规模 非常 大 ， 可 能 会 包括 上 千 个 源 代码 包 和 上 百 万 行 源 代码 。 所 以 ， 对 于 需要 收集 大 
量 源 代码 的 研究 (如 本 章 的 研究 ) 来 说 ， 这 些 发 行 版 是 研究 对 象 的 不 二 选择 。 


8.2 计算 产 代 码 的 指标 


我 们 选择 的 研究 对 象 是 ArchLinux 发 行 版 http://archlinux.org)， 这 个 项 目 包 含 了 上 千 个 开源 
软件 包 。ArchLinux 是 一 个 轻 量 级 的 GNU/Linux 发 行 版 ， 这 个 发 行 版 的 开发 人 员 不 愿 修改 发 行 版 
内 包含 的 软件 源 代码 ， 这 样 的 话 ， 软 件 包 在 正式 发 布 之 后 就 可 以 尽快 地 被 整合 到 发 行 版 中 。 在 
ArchLinux 中 安装 软件 包 有 两 种 方法 : 使 用 官方 预 编译 的 包 , 或 者 用 Arch Build System (ABS) A 
己 从 源 代码 编译 安 疙 。 

ABS 让 用 户 可 以 获得 发 行 版 内 的 软件 的 完整 源 代码 。 这 和 其 他 的 发 行 版 不 同 : 其 他 的 发 行 版 
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会 为 软件 包 的 源 代码 制作 副本 ,并 对 其 打 补 丁 以 便 能 让 其 融入 进发 行 瞩 的 系统 中 。 使 用 ABS, 我 
们 就 能 自动 从 软件 包 的 原始 位 置 (如 项 目 网 站 或 者 储存 库 ) 获取 源 代码 。 这 就 保证 了 源 代码 不 会 
被 修改 , 而 这 也 代表 样本 中 的 案例 研究 相互 之 间 没 有 关联 。 这样 的 独立 性 对 于 人 研究 结果 的 有 效 性 
来 说 至 关 重 要 ， 这 一 点 我 们 将 在 后 面 的 革 方 中 介绍 。 

由 于 ArchLinux 的 规模 较 大 ， 用 它 作 为 研究 对 象 让 我 们 可 以 通过 ABS 获 取 到 上 千 个 开源 软件 
的 项 目 〈 见 示例 8-1)。 





示例 8-1 ArchLinux 的 编译 脚本 首部 样 例 


pkgname=ppl 

pkgver=0.10.2 @ 

pkgrel=2 @ 

pkgdesc="A modern library for convex polyhedra and other numerical abstractions." 
arch=('1686' 'x86_64"') 

url="http://www.cs.unipr.it/ppl" 

license= ('GPL3') 

depends=('gmp>=4.1.3') 

options=('!docs' '!libtool') 
source=(http://www.cs.unipr.it/ppl/Download/ftp/releases/$Spkgver/ppl-S$pkgver.tar.gz) @ 
md5sums=('e7dd265afdeaea81f7e87a72b182d875') O 


O 软件 包 的 版 本 。 用 于 生成 下 载 网 址 。 

O 次 版 本 发 行 号 。 也 用 于 生成 下 载 网 址 。 

O 源 代 码 下 载 网 址 。 

© 源 代 码 tarball 的 校 验 和 。 

示例 8-1 展 示 了 一 个 ABS 编 译 脚 本 首部 的 样 例 。 这 个 样 例 包括 了 各 种 元 信息 ， 这 些 信息 将 用 
于 下 载 源 文件 、 下 载 其 他 依赖 的 软件 包 以 及 在 软件 包 编 译 完成 之 后 对 其 进行 分 类 。 我 们 使 用 了 在 
示例 8-1 中 展示 的 信息 来 下 载 所 有 ArchLinux 中 的 软件 包 的 源 代 码 。 

我 们 使 用 了 SlocCount 工 具 (http://www.dwheeler.com/solccount) 来 确定 下 载 下 来 的 源 代 码 所 
使 用 的 编程 语言 。 我 们 选取 了 C 语 言 的 代码 作为 分 析 的 样本 ， 并 使 用 Libresoft 工 具 的 cmetrics 包 
(http://tools.libresoft.es/cmetrics) 计算 了 多 个 规模 和 复杂 度 的 指标 。 


8.3 ”指标 计算 案例 


表 8-1 总 结 了 本 次 饶 究 中 使 用 的 所 有 指标 ， 以 及 在 后 面 的 图 表 中 代表 这 些 指标 的 缩写 。 
表 8-1 本 次 研究 中 选用 的 指标 


To ë 指标 (对 应 符号 ) 
大 小 源 代码 行 数 (SLOC)， 代 码 行 数 (LOC) 

C 国 数 数量 (FUNC) 
TRE McCabe 圈 复杂 度 一 一 最 大 值 





McCabe 圈 复杂 度 一 一 平均 值 
Halstead 长 度 (HLENG)、 体 积 (HVOLUM)、 水 平 (HLEVE) 以 及 思辨 数 (HMD) 
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用 于 计算 这 些 指标 的 代码 元 素 如 示例 8-2 所 示 。 这 个 文件 是 从 urlgfe 包 (一 个 跨 平 台 的 下 载 
‘er cas) 中 提取 出 来 的 。(urlgfe 最 近 将 名 字 改 为 了 uget ， 所 以 现在 你 将 无 法 在 ArchLinux 中 找 
到 urlgfe。) 这 个 文件 包含 了 预 处 理 指令 (00). ER (如 人 @)， 只 有 一 个 函数 (从 O 开始 )， 
这 个 国 数 包 含 了 一 个 while 循 环 。 


示例 8-2 “C 源 文件 示例 


#ifdef HAVE_CONFIG_H © 
# include <config.h> 
#endif 

2 

/* Specification. */ ©@ 
#include "hash-string.h" 


/* Defines the so called “hashpjw' function by P.J. Weinberger 
[see Aho/Sethi/Ullman, COMPILERS: Principles, Techniques and Tools, 
1986, 1987 Bell Telephone Laboratories, Inc.] */ 
unsigned long int Q 
__hash_string (const char *str_param) 
{ 
unsigned long int hval, g; 
const char *str = str_param; 


/* Compute the hash value for the given string. */ 





hval = 0; 
while (*str t= '\0') 
{ 
hval <<= 4; 
hval += (unsigned char) *str++; 
g = hval & ((unsigned long int) Oxf << (HASHWORDBITS - 4)); 
if (g != 0) 


{ 
hval ^= g >> (HASHWORDBITS - 8); 
hval ^= g; 
} 
} 


return hval; 


} 

O 预 处 理 指 令 ， 算 入 LOC 和 SLOC。 

O 空 行 。 算 入 LOC， 但 是 不 算 入 SLOC。 

O 注释 行 数 。 算 入 LOC， 但 是 不 算 入 SLOC。 
O 代码 ， 算 入 LOC 和 SLOC。 


我 们 可 以 计算 的 最 简单 的 指标 是 和 代码 行 数 相关 的 指标 (如 LOC 和 SLOC)。 函数 的 数量 也 很 
容易 就 能 从 源 代 码 中 计算 出 来 。 其 余 的 复杂 度 指标 ， 即 McCabe 的 圈 复 杂 度 和 Halstead 的 软件 科学 
指标 系列 ， 则 稍微 要 复杂 一 些 。 

除了 MecCabe 的 圈 复 杂 度 以 外 的 指标 都 是 按 文件 来 定义 的 。 所 以 ， 我 们 为 所 有 C 文 件 (由 
SlocCount 识 别 ) 计算 了 这 些 指标 ， 并 忽略 了 头 文 件 〈 即 名 字 结 尾 为 .h 的 文件 )。 

而 根据 定义 ， 对 McCabe 的 圈 复 杂 度 的 计算 必须 是 基于 整个 函数 或 者 程序 ， 因 为 这 个 指标 的 
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对 象 必须 包含 一 个 起 点 和 一 个 (或 多 个 ) 终点 。 我 们 决定 计算 每 个 函数 的 圈 复 杂 度 ， 并 将 一 个 文 
件 的 圈 复 杂 度 按 两 个 方法 做 总 结 : 一 个 是 该 文件 的 所 有 函数 中 复杂 度 中 最 高 值 ， 一 个 是 平均 值 。 

此 外 , 我 们 还 为 每 个 文件 部 计算 了 MD5 散 列 码 , 这 样 我 们 就 可 以 把 重复 的 文件 从 统计 分 析 中 
别 除 ， 因 为 在 统计 中 包含 多 个 同样 的 文件 会 对 结 霖 造成 影响 。 


8.3.1 JR ESTE (SLOC) 
我 们 采用 了 Conte 对 于 这 个 经 典 指标 的 定义 呈 : 
代码 行 是 指 除 了 注释 和 空 行 之 外 的 所 有 程序 文本 行 , 无 论 这 一 行 中 包含 了 多 少 条 语 
后 或 者 语句 段 。 这 个 定义 具体 包括 所 有 的 程序 头 首 (header) 、 各 种 声明 以 及 可 执行 和 
不 可 执行 的 语 如。 
以 示例 8-2 中 的 文件 来 说 ， 如 果 我 们 忽略 空 行 和 注释 ， 但 是 把 预 处 理 磺 指令 和 剩 下 的 代码 行 
算 进 来 的 话 ， 这 个 文件 就 包括 23 SLOC, 


8.3.2 ”代码 行 效 (LOC) 


我 们 使 用 Unix 的 wc 工具 来 计算 了 每 个 源 文件 的 总 代码 行 数 ， 这 次 包括 了 注释 、 空 行 等 。 
这 个 指标 非常 简单 直 白 , 因为 它 算 上 了 所 有 的 空 行 和 注释 , 等 等 。 示例 8-2 包 括 了 32 LOC (5 
有 18 LOC 是 许可 证 的 广 释 文字 ， 与 本 次 研究 无 关 所 以 删除 了 )。 





8.3.3 CHAKI E 

我 们 结合 使 用 了 exuberant-ctags 和 wc 工具 来 计算 每 个 文件 内 的 函数 数量 。 

这 个 指标 更 好 计算 。 示 例 8-2 中 只 包含 了 一 个 函数 ， 所 以 这 个 文件 的 CFUNC 是 1。 
8.3.4 McCabe 圈 复杂 度 


对 于 这 个 指标 , 我 们 采用 的 是 MecCabe 原 论文 中 的 定义 ”, 即 如 何 把 源 代码 文件 用 图 和 区 域 来 
表示 。 任 何 程序 都 可 以 表示 为 一 个 图 。 如 采 我 们 用 图 来 表示 一 个 最 简单 的 语句 ， 即 没有 条 件 、 循 
环 、 分 文 有 的 语句 ， 就 会 是 图 8-1 中 (a) 图 的 样子 。if 语 句 会 被 表示 为 一 个 分 又 ， 如 图 8-1 中 (b) 图 的 样 
子 。 人 循环 语句 则 会 被 表示 为 一 条 边 ， 这 条 边 将 返回 上 一 个 市 扩 。 





图 8-1 ”两 个 图 示例 。 图 (a) 的 CYCLO 是 1， 而 图 (b) 的 CYCLO 是 3 
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如 琳 一 个 图 G 有 n 个 顶点 ，e 条 边 和 p 个 出 口 点 (如 ， 对 于 C 语 言 来 说 就 是 函数 返回 )， 其 复 厅 

度 v 的 定义 如 下 : 
v(G)=e-n+2p 

圈 复 杂 度 指标 (CYCLO) 的 起 始 值 是 1， 代 表 一 系列 按 顺 序 执行 的 无 分 又 或 者 循环 的 语句 。 
每 在 控制 流程 图 中 增加 一 个 区 域 ， CYCLO 的 值 就 增加 1。 比 如 说 ， 如 果 一 个 程序 包含 了 一 个 if 
语句 (没有 else) 的 CYCLO 值 就 是 2， 因 为 这 个 语句 在 控制 流程 图 中 额外 生成 了 一 个 新 的 区 域 。 

示例 8-2 中 的 程序 的 控制 流程 图 如 图 8-2b 所 示 ， 其 CYCLO 值 是 3， 其 中 if 分 又 生成 了 一 个 新 
的 区 域 ( 即 图 中 标 出 的 A 区 域 )， 而 while 循 环 则 生成 了 另 一 个 区 域 ( 即 图 中 标 出 的 B 区 域 )。 还 
有 一 个 C， 代 表 周 边区 域 ， 这 个 区 域 在 圈 复 杂 度 中 永远 算 作 1。 


8.3.5 ” Halstead 软件 科学 指标 


在 这 里 我 们 使 用 了 Kan 对 这 个 指标 的 定义 ”。 需 要 计算 的 有 4 个 指标 : 长 度 、 体 积 、 水 平和 思 
状 数 。 这 些 指标 基于 程序 中 的 操作 符 和 操作 数 的 元 余 程度 。 

在 C 语 言 中 , 操作 数 是 字符 串 常 量 和 变量 的 名 字 。 操作 符 则 包括 各 种 符号 (如 +、-、++ 和 --)、 
间接 操作 符 *、sizeof 操 作 符 、 预 处 理 絮 和 常量、 控制 语句 (如 if 和 while)、 储 存 类 指示 符 (如 
static 和 extern)、 类 型 指示 符 (如 int 和 char) 以 及 结构 指示 符 ( 如 struct 和 union)。 

要 计算 指标 ， 首 先 需 要 计算 程序 使 用 了 多 少 个 不 同 计算 操作 符 (ni1)， 多 少 个 不 同 的 操作 数 
(n2) ,操作 符 的 总 数 Ni) 以 及 操作 数 的 总 数 (M). 程序 的 长 度 L 是 操作 符 与 操作 数 的 数量 之 和 |: 
L=MNitN2 

程序 的 体积 是 其 实际 大 小 ， 定 义 为 : 


V =N-log,(n, +n,) 
程序 的 等 级 几 的 上 限 是 1， 等 级 越 接近 1 则 程序 越 向 单 。 等 级 定义 为 程序 的 体积 和 其 六 在 体积 
( 即 最 少 元 余 的 算法 实现 ) 的 比率 : 





























把 这 个 比率 的 两 方 倒转 ,就 可 以 得 到 常 第 被 人 称 之 为 “代码 难度 ”的 指标 。 最 低 的 难度 是 1， 
上 不 封顶 。 
程序 员 需 要 化 在 理解 程序 上 的 工作 量 & 定 义 为 : 
yV 


E=— 
lv 


这 个 指标 有 时 也 被 称 之 为 程序 员 为 了 理解 一 个 程序 所 必须 的 思辨 mental discrimination) 次 数 。 

Halstead 把 编程 语言 和 目 然 语言 之 间 做 了 一 个 类 比 ， 并 得 出 了 这 些 公 式 。 其 中 心思 想 是 ， 算 
法 的 实现 是 用 语言 来 表述 的 , 如 末 这 个 表述 较 短 或 者 包含 高 见 余 度 的 操作 符 及 操作 数 的 话 , 要 理 
解 起 来 就 更 容易 ， 因 为 这 样 程序 员 需 要 同时 放 在 记忆 中 的 概念 数量 就 会 少 一 些 。 淮 例 来 说 ， 
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Halstead 的 等 级 和 操作 数 的 元 余 度 有 关 。 如 有 果 宛 余 度 很 高 ， 有 很 多 重复 的 操作 数 ，Halstead 的 值 就 
会 较 低 ， 这 表示 程序 复杂 度 较 低 。 这 种 方法 很 好 理解 ， 因 为 这 样 的 元 余 可 以 让 人 更 快 地 学 习 和 理 
解 程序 。 

Halstead 软 件 科 学 指标 和 MecCabe 的 圈 复 杂 度 类 似 ， 都 是 针对 非 模块 化 的 程序 整体 来 定义 的 ， 
不 包括 这 个 程序 导入 的 其 他 元 素 。 和 MecCabe 的 指标 不 同 的 是 ，Halstead 的 指标 并 不 依靠 代码 的 结 
构 来 计算 复杂 度 。 也 就 是 说 ，Halstead 的 指标 纯粹 是 基于 组 成 程序 的 文本 元 素来 定义 的 ， 而 不 是 
基于 语法 单位 〈 如 函数 ) ， 所 以 我 们 把 整个 文件 作为 了 Halstead 指 标的 计算 对 象 。 

示例 8-2 中 所 示 的 样 例文 件 的 Halstead 长 度 为 97， 即 操作 符 (字符 串 常 量 和 变量 名 ) 加 上 操作 
数 (符号 、 语 句 等 ) 之 和 。Halstead 体 积 是 526，Halstead 等 级 是 0.036。 思 辨 次 数 是 14490， 即 体积 和 
等 级 的 商 。 几 乎 所 有 的 指标 都 是 数值 越 大 越 复 杂 ， 除 了 Halstead 等 级 ， 这 个 指标 是 数值 越 小 越 复杂 。 


8.4 统计 分 析 


ArchLinux 库 中 包含 了 4096 个 软件 包 (截至 2010 年 4 月 )， 其 中 有 些 包 是 同一 个 软件 的 不 同 版 
本 。 在 移 除 了 不 同 的 版 本 之 后 ， 我 们 得 到 了 4015 个 软件 包 ， 共 1272748 个 源 代码 文件 。 在 这 些 文 
件 中 ， 有 576511 个 文件 是 用 C 语 言 写 的 。 不 过 ， 其 中 还 有 重复 的 文件 。 最 后 ， 我 们 共 找 出 776573 
个 互 不 相同 的 文件 ， 其 中 用 C 语 言 写成 的 只 有 338831 个 。 在 这 些 C 语 言 源 文件 中 ， 有 212167 个 不 
征 头 文件 ， 剩 余 126664 个 征 头 文件 。 

我 们 按照 前 一 节 中 摘 述 的 针对 示例 8-2 中 的 计算 方法 为 所 有 这 些 C 语 言 产 文件 进行 了 指标 的 
计算 。 最 后 ， 我 们 得 到 了 超过 300000 条 指标 数据 。 每 条 数据 邦 包 含 了 一 组 9 个 指标 的 元 组 。 


8.4.1 总 体 分 析 


我 们 首先 对 这 9 个 指标 之 间 的 相互 联系 在 文件 级 别 上 进行 基本 分 析 。 目标 是 对 这 9 个 指标 进行 
标准 化 的 工作 , 以 得 到 一 套 统 一 的 软件 规模 和 复杂 度 指标 。 我 们 的 目标 是 从 这 些 指标 中 找 出 无 法 
提供 进一步 信息 的 ， 并 移 除 。 

在 分 析 中 ， 我 们 把 每 个 文件 都 看 做 是 一 个 独立 的 数据 点 。 这 个 假设 是 比较 适当 的 ， 因 为 重复 
的 文件 已 被 移 除 ， 而 且 这 些 文 件 都 来 自 相 互 独立 的 项 目 。 为 了 研究 相关 性 我 们 决定 使 用 指标 值 的 
对 数值 。 我 们 是 在 测算 了 最 佳 理想 的 Box-Cox 权 重 变形 国 数 之 后 做 出 了 这 个 选择 。 在 得 到 了 所 有 
指标 的 对 数值 之 后 , 我 们 又 对 它们 进行 了 线性 回归 分 析 , 并 计算 了 他 们 的 Pearson 相 关系 数 。Pearson 
系数 接近 1 就 代表 两 个 变量 是 紧密 相关 的 ， 而 如 果 系 数 接近 0， 则 意味 着 变量 之 间 互 不 影响 。” 

表 8-2 展 示 了 所 有 的 指标 之 间 的 Pearson 相 关系 数 。 这 个 表格 是 对 称 的 ， 也 束 是 说 ， 在 对 角 线 
上 下 的 值 是 一 样 的 ， 因 为 无 论 谁 先 谁 后 或 者 谁 依赖 谁 ， 两 个 变量 之 间 的 相关 系数 都 是 相同 的 。 所 
以 在 表 8-2 中 我 们 只 保留 了 一 半 的 数据 ， 以 免 让 人 感觉 混乱 。 大 部 分 指标 之 间 的 相关 系数 都 非常 
































O 维基 百科 包含 了 关联 性 分 析 和 Box-Cox 权 重 变形 函数 的 详细 信息 ， 详 见 http://en.wikipedia.org/wiki/Correlation__ 
coefficient 和 http://en.wikipedia.org/wiki/Box-Cox transformation (于 2010 年 4 月 3 日 访问 )。 
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高 ， 这 表明 了 他 们 之 间 有 非 稼 密切 的 关联 。 我 们 着 重 展示 了 LOC、SLOC 同 其 他 指标 之 同 那些 较 
高 的 相关 系数 ,由 此 我 们 可 以 看 出 大 部 分 的 复杂 度 指标 其 实 都 和 这 两 个 简单 的 指标 相互 呼应 。 高 
相关 性 意味 着 两 个 指标 所 提供 的 复杂 度 的 信息 量 差不多 。 比 如 ，Halstead 的 长 度 以 及 SLOC 的 关联 
系数 高 达 0.97， 所 以 我 们 用 它们 中 的 任何 一 个 来 确定 文件 的 复杂 度 结 来 都 不 会 有 什么 差别 。 


表 8-2 ”指标 之 间 的 关联 系数 
SLOC LOC NFUNC MCYCLO ACYCLO HLENG HVOLU HLEVE HMD 





SLOC 1.00 0.97 0.68 0.77 0.63 0.97 0.97 0.88 0.96 
LOC 1.00 0.67 0.75 0.60 0.94 0.94 0.84 0.92 
NFUNC 1.00 0.63 0.32 0.64 0.63 0.67 0.66 
MCYCLO 1.00 0.91 0.76 0.75 0.82 0.80 
ACYCLO 1.00 0.63 0.62 0.72 0.68 
HLENG 1.00 0.99 0.90 0.99 
HVOLU 1.00 0.90 0.98 
HLEVE 1.00 0.96 
HMD 1.00 


有 的 复杂 度 指标 则 和 其 他 的 不 太 相 关 。 比 如 ，McCabe 复 杂 度 的 最 大 值 ( 即 表 8-2 中 的 
MCYCLO) 和 平均 值 \(ACYCLO) ， 与 SLOCLOC 的 关联 度 都 不 高 。 我 们 能 人 否 找到 原因 呢 ? 

MCYCLO 和 ACYCLO 都 和 代码 的 结构 有 关 : 分 又 和 循环 越 多 ， 这 些 值 就 越 高 。 这 可 能 造成 
了 MecCabe 指 标 和 代码 行 指标 之 同 的 不 统一 ， 即 头 文 件 和 非 头 文件 之 同 的 区 别 。 

两 类 文件 我 们 都 做 了 分 析 。 在 C 语 言 中 , 头 文件 大 多 包含 的 征 国 数 和 实体 的 规范 信息 。 不 过 ， 
它们 还 可 能 包括 条 件 预 处 理 指令 ,这些 指令 都 是 编译 时 解析 的 ， 而 不 是 在 运行 时 。 虽 然 条 件 预 处 
理 指令 也 属于 分 又 的 一 种 ， 但 是 我 们 的 工具 并 不 把 它们 看 做 古 程 序 控制 流程 图 中 的 区 域 。 所 以 ， 
无 论 头 文件 是 大 古 小 ， 它 们 的 McCabe 圈 复杂 度 都 会 偏 低 。 也 就 古 说 ， 如 来 想 要 找 出 代码 行 和 图 
复杂 度 之 间 到 底 有 没有 关系 ， 我 们 应 该 把 头 文 件 也 从 统计 中 移 除 。 


8.4.2” 头 文件 和 非 头 文件 之 间 的 区 别 
如 果 我 们 把 这 些 样本 分 成 两 份 ， 一 个 对 应 头 文件 而 另 一 个 则 对 应 非 头 文件 ， 相关 系数 的 值 就 


会 改变 。 

我 们 这 里 只 包含 了 这 些 指标 中 的 几 个 。 这 里 没有 包含 的 指标 在 原来 的 总 体 分 析 和 后 面 把 样本 
分 成 两 份 的 分 析 中 ， 相 关系 数 都 非常 高 。 所 以 ， 为 了 简明 起 见 ， 我们 在 结果 的 表格 中 省 去 了 这 些 
指标 。 


表 8-3 列 出 了 头 文 件 鸭 统计 结 末 。 我 们 看 重 显 示 了 两 个 相关 系数 ， 这 两 个 系数 表明 在 头 文件 
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中 ， 圈 复杂 度 和 SLOC 之 间 的 关联 度 很 低 。 另 一 个 复杂 度 系数 ，Halstead 等 级 〈 即 表 中 的 HLEVE) 
则 和 SLOC 密 切 相 关 。 这 个 结 末 在 意料 之 中 ， 因 为 头 文件 无 论 有 多 大 ， 都 是 属 于 疫 有 分 又 一 路 到 
底 的 类 型 。 所 以 ， 这 些 文件 的 圈 复 办 度 总 是 会 很 低 ， 所 以 和 文件 大 小 ( 即 LOC/SLOC) 的 相关 性 
就 会 很 小 了 。 比 如 说 ， 圈 复杂 度 最 大 值 (MCYCLO) 在 全 部 文件 中 的 平均 值 是 2， 中 位 数 是 1， 
这 表明 大 部 分 的 文件 的 MCYCLO 都 小 于 等 于 2。 但 是 ， 由 于 圈 复 杂 度 和 文件 大 小 之 间 相 互 独 芯 ， 
这 意味 着 我 们 不 能 使 用 圈 复 杂 度 作为 衡量 头 文件 复杂 度 的 指 祭 。 此 外 ， 有 趣 的 征 ， 所 有 其 他 的 复 
杂 度 指标 都 和 文件 大 小 紧密 相关 。 





表 8-3” 头 文件 的 关联 系数 


SLOC MCYCLO ACYCLO HLEVE 
SLOC 1.00 0.37 0.34 0.72 
MCYCLO 1.00 0.97 0.49 
ACYCLO 1.00 0.46 
HLEVE 1.00 
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的 相关 性 不 太 高 ， 那 就 是 ACYCLO ， 圈 复杂 度 的 平均 值 。 但 是 ， 这 个 指标 和 圈 复 杂 度 最 大 值 
(MCYCLO) 的 关联 系数 很 高 ,而 MCYCLO 本 身 和 文件 大 小 是 紧密 相关 的 。Halstead 等 级 (HLEVE ) 
也 和 非 汰 文件 的 大 小 紧密 相关 。 


表 8-4” 非 头 文件 的 关联 系数 


SLOC MCYCLO ACYCLO HLEVE 
SLOC 1.00 0.83 0.60 0.91 
MCYCLO 1.00 0.86 0.82 
ACYCLO 1.00 0.65 
HLEVE 1.00 


那么 , 从 这 些 紧密 关联 的 指标 中 ,我们 又 能 得 出 什么 结论 呢 ?” 是 不 古 说 简单 的 代码 行 和 那些 
复杂 的 指标 (比如 McCabe 和 Halstead) 一 样 好 ? 在 开始 总 结 之 前 ， 让 我 们 先 看 看 一 些 软 件 指标 的 
相关 文章 。 


8.4.3 干扰 效应 : 文件 大 小 对 相关 性 的 影响 


在 研究 界 , 用 源 代码 作为 样本 来 对 各 种 指标 进行 实际 验证 非 弟 流行 。 这 些 研 究 中 的 大 部 分 者 
和 本 章 介绍 的 研究 相似 。El Eman 等 人 “对 很 多 验证 研究 进行 了 一 次 详细 的 分 析 ， 并 就 这 类 统计 
研究 的 有 效 性 提出 了 一 些 质 疑 。 尤其 古 , 研究 者 们 证 明了 类 的 大 小 会 影响 到 用 于 预测 故障 的 面向 
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对 象 的 指标 的 有 效 性 。 如 末 重 复 同样 的 实验 ， 只 是 对 实验 对 象 的 大 小 加 以 控制 ,那么 很 多 结论 就 
无 法 成 立 。 

由 于 我 们 的 研究 的 对 象 是 文件 而 不 是 类 ,而 且 不 同类 别 的 指标 的 设计 理念 又 不 同 ,所 以 我 们 
无 法 在 这 次 研究 中 直接 应 用 这 种 方法 , 不 过 我 们 仍然 应 该 蕉 碟 到 我 们 的 指 剑 有 可 能 会 被 文件 大 小 
所 干扰 。 为 了 测试 是 任 存 在 干扰 效应 ， 我们 把 所 有 多 结 霖 按 文件 大 小 分 类 ,看 看 相关 系数 会 不 会 
随 看 文件 的 大 小 而 改变 ， 也 看 看 我 们 的 结论 会 不 会 随 着 文件 大 小 而 改变 。 

1. 文件 大 小 对 于 头 文件 的 相关 性 的 影响 

表面 我 们 已 经 介绍 过 ，McCabe 的 圈 复 杂 度 和 文件 大 小 的 相关 性 很 低 ， 人 然后 我 们 认为 不 应 该 
为 头 文件 计算 这 个 指标 ， 因 为 头 文件 和 分 又 的 关系 很 不 请 楚 。 图 8-2 展 示 了 在 文件 大 小 变化 的 时 
候 ， 圈 复杂 度 〈 坚 列 ) 和 SLOC ( 横 列 ) 之 间 的 相关 系数 的 变化 。 我 们 把 文件 分 成 了 20 个 等 级 ， 
每 个 包含 了 同样 数量 的 文件 ,并 只 用 这 些 文件 来 计算 相关 系数 。 由 于 文件 大 小 的 范围 很 广 ， 横 列 
用 对 数 刻 度 展示 。 两 条 曲线 分 别 代 表 圈 复杂 度 最 大 值 MCYCLO) 和 圈 复 杂 度 平均 值 ( ACYCLO)。 

乍 一 看 ， 对 于 很 小 的 文件 来 说 ， 二 者 几乎 没有 什么 关联 (关联 系数 接近 0)， 而 关联 系数 随 着 
文件 大 小 增长 ， 直 到 差不多 500 SLOC 的 时 候 ， 才 平稳 了 下 来 。 对 于 非常 大 的 文件 来 说 ， 相 关系 
数 的 变化 不 大 。 

我 们 可 以 从 图 8-2 中 得 出 两 个 结论 。 首 先 ， 非 第 大 的 文件 应 该 从 样本 中 移 除 。 不 过 ， 这 些 文 
件 对 于 相关 系数 的 影响 非常 小 , 这 一 点 我 们 可 以 从 图 中 的 相关 位 置 很 少 的 增长 中 看 出 。 第 二 个 结 
论 征 文件 的 大 小 确实 会 对 相关 性 产生 影响 。 不 过 这 不 会 对 我 们 的 头 文件 统计 结 末 造 成 影响 ， 因 为 
无 论文 件 多 大 多 小 ， 相 关系 数 都 非常 低 。 不 过 ， 其 余 的 相关 系数 又 会 受到 怎样 的 影响 呢 ? 








le+01 le+03 le+05 


SLOC 
图 8-2 ” 头 文 件 的 大 小 对 于 其 圈 复 洒 度 和 SLOC 的 相关 性 的 影响 


2. 文件 大 小 对 于 非 头 文件 的 相关 性 的 影响 
图 8-3 展 示 了 非 头 文件 的 大 小 对 于 其 圈 复 杂 度 和 SLOC 的 相关 性 的 影响 。 公 列 展示 的 古 相关 系 
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数 的 值 ， 而 横 列 仍 用 对 数 刻度 展示 ， 表 示 文 件 的 SLOC 值 。 两 条 曲线 分 别 代表 圈 复 杂 度 最 大 值 
(MCYCLO) 和 圈 复 杂 度 平均 值 (ACYCLO), 

和 上 次 一 样 ， 我 们 可 以 观察 到 文件 大 小 对 于 相关 系数 确实 有 影响 。 不 过 ,这 些 值 在 文件 达到 
一 定 大 小 之 后 就 稳定 了 (对 MCYCLO 来 说 约 为 1000SLOC， 对 ACYCLO 来 说 约 500SLOC)。 对 于 
非常 小 的 文件 来 说 ， 低 相关 系数 是 可 以 理解 的 ， 因 为 小 文件 的 差异 度 非 常 之 高 。 对 于 中 等 大 小 的 
文件 来 涪 ， 相 关系 数 和 前 一 节 中 展示 的 类 似 。 

3. 文件 大 小 对 Halstead 软 件 科 学 指标 的 影响 

图 8-3 展 示 了 文件 的 大 小 对 于 Halstead 指 标 和 SLOC 的 相关 性 的 影响 。 和 之 前 相同 ， 坚 列 展 示 
的 是 相关 系数 ， 横 列 按 对 数 刻度 展示 文件 大 小 ，4 条 曲线 每 条 代表 一 个 指标 。 

这 里 ， 曲 线 的 模式 和 前 面 的 差不多 ， 尽 管 所 有 指标 的 一 致 性 更 高 一 些 。 虽 然 文 件 大 小 对 相关 
系数 造成 了 有 影响， 但 是 无 论文 件 多 大 多 小 ， 相 关系 数 都 很 高 。 














le+01 le+02 le+03 le+04 le+05 
SLOC 
图 8-3” 非 汰 文件 的 大 小 对 于 其 圈 复 杂 和 SLOC 的 相关 性 的 影响 


4. 关于 文件 大 小 的 干扰 效应 的 总 结 

虽然 文件 的 大 小 的 确 会 影响 相关 系数 的 值 , 但 生 这 样 的 影响 并 不 会 对 我 们 从 相关 系数 中 得 出 的 
结论 造成 很 大 影响 。 事 实 上 , 类 的 大 小 对 于 面向 对 象 的 指标 的 干扰 效应 的 观点 也 受到 了 一 些 批评 “。 

在 本 次 研究 中 , 我 们 可 能 应 该 移 除 非 第 大 的 文件 ， 因 为 这 些 文件 也 许 会 使 我 们 的 结论 产生 偏 
闺 。 我 们 对 这 些 文件 进行 了 随机 抽查 。 有 的 文件 似乎 是 目 动 生成 的 ， 所 以 不 应 该 出 现在 源 代码 复 
杂 度 的 分 析 中 。 也 就 是 说 , 这些 文件 不 会 由 程序 员 来 阅读 和 修改 ， 因 为 它们 邦 古 目 动 从 程序 员 写 
的 源 代 码 文 件 中 目 动 生成 出 来 的 。 不 过 无 论 如 何 ， 这 样 的 影响 也 不 会 很 大 ,正如 我 们 前 面 的 几 张 
图 所 示 。 

我 们 这 里 提供 一 些 实用 的 建议 , 当 在 其 他 项 目 中 应 用 本 章 所 展示 的 方法 的 时 候 , 我 们 推 存 研 
究 员 们 按 文件 大 小 来 进行 分 析 ， 这 样 就 可 以 测试 是 否 相 关系 数 会 随 着 文件 大 小 而 改变 。 
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SLOC 
8-4” 非 头 文件 的 大 小 对 于 其 Halstead 软 件 科 学 指标 和 SLOC 的 相关 性 的 影响 


8.5 ”天 于 统计 学 方法 的 一 些 说 明 


统计 学 的 分 析 会 从 数据 中 提取 结论 , 而 有 很 多 因素 都 会 威胁 到 这 些 结论 的 有 效 性 。 回 到 本 章 
开头 “出 口 调查 ”的 例子 , 受 访 者 在 社会 经 济 地 位 上 的 不 同 可 能 会 影 啊 出 口 调查 的 结构 。 要 想 做 
一 份 可 徘 的 出 口 调查 , 必须 随机 选择 受 访 者 , 人 否则 的 话 , 调查 就 无 法 准确 地 预测 选 从 的 实际 结 琳 。 
同样 ,本草 所 展示 的 统计 结 末 可 能 会 受到 别 的 什么 因素 的 干扰 ,而 我 们 的 结论 也 可 能 无 法 适用 于 
所 有 的 软件 项 目 。 为 了 我 们 的 研究 的 完整 起 见 , 我们 这 里 讨论 一 下 会 对 研究 有 效 性 有 威胁 的 因素 。 

O 你 可 能 首先 会 注意 到 本 半 所 示 的 相关 系数 的 统计 显 兰 性 问题 。 由 于 统计 学 上 的 特性 以 及 样 

本 量 的 规模 巨大 (达到 了 十 万 级 ) ,本 次 研究 数据 的 显 铸 水 平一 直 都 非常 高 (达到 99.99% 级 )。 

口 从 软件 开发 的 角度 来 说 ,这 次 研究 应 该 扩展 到 其 他 的 编程 语言 。 这 里 所 展示 的 C 语 言 相关 
结论 可 能 对 其 他 语言 并 不 适用 。 虽 然 C 是 目前 开源 社区 中 最 流行 的 编程 语言 ( 按 现 有 可 利 
用 的 代码 来 算 )， 但 是 还 有 其 他 很 流行 的 编程 语言 ， 它 们 增长 的 速度 比 C 快 很 多 ， 而 且 也 
有 大 量 的 代码 可 以 利用 。 

口 最 后 本 次 研究 所 涉及 的 所 有 源 代 码 都 是 从 公开 的 开源 项 目 中 得 来 。 虽 然 我 们 相信 开源 的 
软件 和 其 他 类 型 的 软件 之 间 并 不 存在 技术 上 的 差异 ， 但 是 这 种 对 样本 的 选择 还 是 可 能 会 
影 啊 到 我 们 结论 的 有 效 性 。 尤 其 是 ， 我 们 的 结论 可 能 不 适用 于 在 不 同 的 条 件 下 开发 的 软 
件 。 要 想 解 决 这 个 有 效 性 的 问题 ， 就 应 该 使 用 其 他 领域 (如 商业 、 科 学 软件 ) 中 得 来 的 
代码 来 重复 本 次 实验 。 


8.6 ”还 需要 其 他 的 复杂 度 指标 吗 
本 章 所 展示 的 结果 表明 ， 对 于 用 C 语 言 写成 的 非 头 文件 来 说 ， 所 有 的 复杂 度 指标 都 和 代码 行 
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紧密 相关 ， 所 以 更 复杂 的 指标 并 不 能 提供 比 简单 的 代码 行 更 多 的 信息 。 

不 过 ， 在 接受 这 个 结论 的 时 候 ， 有 几 点 需要 注意 。 对 头 文件 的 分 析 显 示 ， 圈 复杂 度 和 其 他 指 
标的 相关 性 很 低 。 我 们 认为 这 是 由 这 类 文件 的 性 质 决定 的 。 换 名 话说 ， 头 文件 中 没有 实现 ， 只 
规范 信息 。 我 们 想 要 用 “理解 程序 ”这 个 概念 来 定义 和 计算 复杂 度 。 当 然 ， 程 序 员 也 需要 阅读 和 
理解 头 文件 ， 这 也 意味 着 头 文件 也 会 造成 一 定 程 度 的 复杂 度 。 不 过 ,， 圈 复杂 度 和 代码 行 之 间 的 相 
关 性 很 低 并 不 意味 着 这 个 指标 就 是 一 个 好 的 头 文件 复杂 度 指 标 。 正 相反 , 这样 的 低 相 关 性 只 是 由 
于 头 文件 缺乏 控制 结构 。 这 些 文件 中 没有 循环 、 分 叉 等 ， 所 以 无 论文 件 大 还 是 小 ， 它 们 的 圈 复 杂 
度 都 最 低 。 

对 于 非 头 文件 来 说 , 所 有 的 指标 都 显示 出 了 与 LOC 非 常 高 的 相关 性 。 我 们 测试 了 文件 大 小 的 
干扰 效应 ， 结 果 显 示 ， 无 论文 件 大 小 ， 相 关 性 都 很 高 。 

我 们 认为 , 这 次 研究 明确 地 教会 了 我 们 一 课 , 即 语法 上 的 复杂 度 无 法 包揽 软件 复杂 度 的 全 部 。 
仅仅 基于 程序 结构 或 者 文字 特性 (比如 Halstead 指 标 所 关注 的 元 余 度 ) 的 复杂 度 指标 无 法 告诉 我 
们 理解 一 段 代码 需要 的 工作 量 , 或 者 我 们 至 少 可 以 说 , 这 些 复杂 的 指标 并 不 能 比 代码 行 告诉 我 们 
的 更 多 。 这 会 对 我 们 如 何 应 用 这 些 指 标 造 成 影响 。 特 别 是 缺陷 预测 、 开 发 和 维护 工作 量 模型 以 及 
统计 学 模型 ,通常 来 说 ， 它 们 无 法 从 这 些 指标 上 获得 更 多 的 好 处 ， 而 代码 行 应 该 被 视 作 这 些 模型 
的 首选 和 唯一 指标 。 

软件 研究 界 曾 经 面临 过 代码 复杂 度 和 理解 复杂 度 的 对 比 问题 。 现在 已 经 有 人 提出 了 一 种 语义 
Wit, 这 种 指标 基于 程序 中 标识 符 的 含糊 程度 。 有 趣 的 是 , 这 种 指标 非常 适合 于 故障 的 预测 中 。 

这 并 不 意味 着 我 们 疫 有 从 传统 的 复杂 度 指标 身上 学 到 什么 。 首 先 ,， 圈 复杂 度 非常 好 的 表示 出 
了 测试 程序 时 所 需 遍 历 的 路 径 数 量 。Halstead 的 软件 科学 指标 也 给 了 我 们 一 些 有 趣 的 经 验 : 总 是 
有 很 多 不 同 的 方法 来 做 同一 件 事 。 所 以 ,如果 你 选择 一 种 方式 并 在 程序 的 多 个 地 方 进行 运用 ,你 会 
让 你 的 代码 的 元 余 度 增高 ， 这 会 让 代码 更 简单 、 更 容易 阅读 一 一 即便 其 他 的 统计 数据 不 这 样 认为 。 
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捧 件 工程 的 特有 话题 





这 一 部 分 





把 之 前 那 部 分 的 想法 运用 于 编程 和 软件 开发 领域 的 奋 干 退 切 话题 中 。 这 些 话 题 中 的 
大 部 分 是 有 普遍 争议 的 ， 呈 现 多 方 搜 鸣 的 态势 ， 每 一 方 都 有 热情 的 支持 者 。 程 序 员 对 这 些 问 题 的 
态度 会 影响 他 们 的 日 凋 行 为 ， 并 控制 雇佣 和 预算 的 决定 。 你 会 在 这 一 部 分 的 书 中 学 到 我 们 能 在 多 
大 程度 上 相信 当前 这 些 信念 。 


第 9 章 
目 动 故障 预报 系统 实例 一 则 


Elaine J. Weyuker 
Thomas J. Ostrand 





te abs 2 FP RP see Tok, eA whe KER, bug), WA, FRANSE 
用 软件 测试 技术 来 找 出 这 些 问 题 然 后 解决 , 但 是 当 软 件 系 统 的 规模 很 大 的 时 候 , 全 面 测 试 可 能 会 
耗费 大 量 的 人 力 物力 。 

如 来 可 以 准确 预测 出 系统 中 最 有 可 能 出 现 故 障 的 部 分 , 那么 开发 人 员 、 测 试 人 员 以 及 管理 者 
们 就 可 以 大 量 扩 省 寻找 这 些 赦 障 的 上 时间， 如 此 , 不 但 能 提高 测试 效率 ， 也 能 提高 短缺 资源 的 利用 
率 。 在 过 去 的 几 年 里 , 我 们 设计 了 一 些 数 学 模型 ,用 于 预测 软件 系统 在 下 一 个 版 本 发 布 时 每 个 文 
件 中 的 故障 数量 。 然 后 ,开发 人 员 融 可 以 按照 预 佑 故 隐 数量 由 多 到 少 来 为 这 些 文件 排序 ， 所 以 很 
容 匈 看 出 哪些 文件 最 可 能 出 故障 。 

现在 , 我 们 用 其 中 一 个 模型 做 了 一 个 自动 化 的 工具 , 用 于 帮助 项 目 管理 者 优先 分 配 工作 给 最 
容易 出 故障 的 文件 。 例 如 , 项目 经 理 可 以 为 这 些 文件 安排 更 多 的 测试 时 间 ， 指 派 团 队 中 最 好 的 开 
发 人 员 来 修改 这 些 文件 , 或 者 为 这 些 文件 进行 代码 检查 。 这 样 ， 就 可 以 更 快 地 发 现 故 障 ， 并 降低 
测试 的 成 本 。 此 外 , 这样 的 方法 还 可 能 会 空 出 一 些 资 源 , 使 项 目 组 可 以 对 整个 系统 进行 更 多 的 测 
试 ， 这 样 软件 的 可 靠 度 就 会 更 高 。 


9.1 故障 的 分 布 


大 型 的 企业 级 软件 系统 通 肖 开发 周期 很 长 , 参与 的 开发 人 员 也 很 多 , 而 且 会 定期 发 布 更 新 版 
本 。 一 般 坊 则 的 看 法 是 ， 大 型 系统 经 过 几 个 早期 版 本 之 后 ， 在 后 续 版 本 中 的 bug 通 第 会 集中 在 相 
对 较 小 的 一 个 部 分 的 代码 中 。 这 样 的 bug 分 布 常 各 被 称 之 为 帕 累 托 分 布 (Pareto distribution), ， 即 
80% 的 bug 都 存在 于 20% 的 代码 实体 (如 文件 或 方法 ) 中 。 如 条 系统 测试 和 调试 人 员 可 以 找 出 哪些 
文件 属于 那 20% 会 出 问题 的 文件 的 话 ， 他 们 的 工作 就 会 轻松 很 多 ， 因 为 这 样 他 们 就 能 高 效 地 专注 
于 质量 保证 的 工作 (比如 测试 、 检 测 和 调试 )， 而 不 是 在 寻找 问题 上 浪费 时 间 。 

在 AI&TI 工 作 期 间 ， 我 们 接触 到 了 不 少 开 发 周期 非常 长 的 大 型 系统 ， 所 以 做 了 一 份 研究 。 研 
究 目 的 如 下 : 
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O 在 系统 测试 阶段 之 前 识别 出 代码 中 最 可 能 出 现 bug 的 部 分 ， 
O 设计 和 实现 一 个 编程 环境 工具 ， 用 于 识别 系统 中 最 容易 出 现 bug 的 部 分 ， 并 把 这 个 信息 展 
示 给 开发 人 员 以 及 测试 人 员 。 

当然 ， 只 有 故障 真正 集中 在 系统 的 未 些 部 分 ， 才 会 有 “系统 中 最 容 多 出 现 bug 的 部 分 ”这 个 
概念 。 所 以 为 了 确保 这 个 概念 的 可 行 性 ， 我 们 首先 需要 找到 证 据 来 证 明 bug 在 代码 中 的 分 布 确实 
是 像 帕 系 托 分 布 那 样 高 度 倾斜 的 。 

我 们 研究 了 AT&T 不 同 部 门 经 和 常 使 用 的 6 个 大 型 系统 ， 结 琳 如 表 9-1 所 示 。 它 们 的 目的 包括 库 
存 控 制 、 供 应 调度 、 维 护 文 持 、 目 动 语音 应 答 处 理 。 这 些 都 是 真实 的 商业 系统 ， 它 们 产生 的 bug 
也 都 是 真实 存在 过 的 ， 大 部 分 这 些 bug 痢 在 内 部 测试 中 被 发 现 并 处 理 了 ， 但 是 也 有 一 些 在 发 布 之 
后 才 被 用 户 发 现 。 

有 三 个 系统 是 由 内 部 的 软件 开发 组 织 来 开发 和 维护 的 ,而 另外 三 个 则 是 外 包公 司 做 的 。 他 们 
的 规模 从 30 万 行 到 超过 50 万 行 源 代码 不 等 ， 而 生命 周期 则 是 从 2 年 到 接近 10 年 。 每 个 系统 都 包括 
了 不 同 编程 语言 的 代码 ， 少 的 有 4 个 ， 而 有 一 个 系统 则 超过 50 种 语言 。 这 些 系统 的 开发 历史 严格 
遵循 定期 发 布 版 本 中 的 规律 ， 通常 每 三 个 月 发 布 一 个 新 版 本 ， 除 了 一 个 例外 (后面 将 会 讲 到 )。 

从 对 这 些 系统 的 研究 中 得 到 的 数据 完全 支持 天 于 bug 的 由 紫 托 分 布 假 说 。 在 对 第 一 个 系统 进 
行 的 预备 研究 中 ， 我 们 发 现在 其 第 2 到 第 9 个 版 本 时 ，bug 集 中 在 少 于 20% 的 文件 中 ， 而 在 第 9 个 版 
本 之 后 的 版 本 中 bug 则 更 为 集中 地 存在 于 少 于 10% 的 文件 中 。 


表 9-1 系统 总 览 


2 g 总 版 ”正式 发 布 使 ”平均 每 版 ”平均 每 版 本 平均 每 版 本 平均 每 版 本 包含 ”文件 中 包含 bug 
AR = 本 数 “用 时 间 ( 年 ) ”本 文件 数 KSLOC 的 bug 数 bug 的 文件 % 的 代码 行 数 % 





库存 管理 17 4 1318 363 301 10.4 28.7 
供应 调度 9 2 2178 416 34 1.3 5.7 
语音 应 答 9 225 1341 228 165 10.1 16.9 
维护 支持 A 35 9 550 333 44 4.8 17.4 
维护 支持 B 35 9 1237 300 36 1.9 13.7 
维护 支持 C 27 7 437 219 42 4.8 14.3 


这 使 我 们 确信 ,设计 故障 预测 模型 确实 是 有 意义 的 。 在 对 这 些 系 统 进行 的 研究 中 ， 我 们 不 断 
发 现 新 的 证 据 来 证 实 帕 权 托 分 布 确 实 存 在 ,也 就 是 说 , 这些 项 目 中 的 故障 都 令 人 吃 居 地 集中 在 代 
码 的 非常 小 的 部 分 里 。 其 中 有 两 个 系统 ， 平 均 每 个 版 本 bug 文 件 的 百分比 少 于 10.5。 还 有 两 个 系 
统 的 bug 只 存在 于 5% 的 文件 中 。 剩 下 还 有 两 个 系统 ， 只 有 2% 的 文件 中 包含 了 bug。 说 得 更 明日 点 ， 
就 是 : 在 我 们 所 研究 的 6 个 系统 中 ， 大 概 有 90% (其 至 更 多 ) 的 文件 在 发 布 前 的 测试 以 及 正式 发 
布 以 后 的 使 用 中 都 没有 发 现 bug。 虽 然 包含 bug 的 文件 贡 毅 会 比 不 包含 bug 的 文件 要 大 一 些 , 但 是 6 
个 系统 中 有 5 个 ， 其 中 有 bug 的 源 代码 行 数 也 只 占 到 不 到 总 量 的 18% 而 已 。 

表 9-1 展 示 了 每 个 系统 的 bug 集 中 度 ， 以 及 其 他 的 一 些 重要 的 数据 。 表 的 第 2 和 第 3 列 用 发 布 的 
版 本 数量 以 及 存在 的 时 间 长 度 来 表示 这 个 系统 的 年 龄 。 剩余 的 儿 列 所 展示 的 是 每 个 系统 全 版 本 的 
平均 值 。 这 些 数值 分 别 是 : 文件 数量 、 有 多 少 千 行 源 代码 (KSLOC)、 平 均 bug 数 、 包 偏 bug 的 文 
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件 占 文件 总 数 的 百分比 ,以 及 包含 bug 的 代码 行 数 占 总 行 数 的 百分比 , 这些 数值 体现 了 系统 的 规模 。 

一 般 说 来 ， 系 统 开 发 周期 越 长 ， 新 增加 的 功能 也 就 越 多 ， 文 件 的 数量 也 会 随 着 增长 。 所 以 ， 
表 9-1 中 所 示 的 平均 文件 数量 以 及 平均 代码 行 数 比 那些 较 晚 发 布 的 系统 要 少 一 些 。 表 9-2 展 示 的 是 
每 个 系统 最 新 版 本 的 文件 数量 以 及 源 代 码 行 数 , 以 此 来 判断 其 规模 大 小 , 此 外 还 有 我 们 的 预测 结果 。 

当 开 发 组 织 非常 大 , 参与 开发 的 程序 员 和 测试 人 员 非 党 多 的 时 候 , 就 必须 要 有 系统 的 缺 陷 报 
告 机 制 、 变 更 管理 以 及 版 本 控制 。 我们 研究 的 这 些 系 统 使 用 了 同一 个 工具 来 解决 这 些 问题 。 这 个 
工具 会 把 所 有 对 代码 的 修改 记录 在 一 个 修改 请 求 (Modification Request, 下 简称 MR) 中 ， 这 个 
MR 将 描述 需要 的 修改 ,并 记录 下 实际 做 了 的 修改 。MR 可 以 请 求 对 系统 任何 方面 的 修改 ,包括 系 
统 需 求 到 设计 文档 、 人 代码、 使 用 文档 等 ， 都 可 以 。 


表 9-2 这些 系 统 包 含 bug 最 多 的 20% 文 件 中 包含 的 故障 百分比 





A 统 最 新 版 文件 数 最 新 版 KSLOC 20% 最 多 bug 的 文件 中 包含 了 故障 % 
库存 管理 1950 538 83% 
供应 调度 2308 438 83% 
语音 应 答 1888 329 75% 
维护 支持 A 668 442 81% 
维护 支持 B 1413 384 93% 
维护 支持 C 584 329 76% 


系统 设计 师 想 要 改变 某 些 功能 可 以 提交 MR， 程 序 员 想 要 为 他 负责 的 程序 的 一 部 分 采纳 更 有 
效 的 算法 的 时 候 可 以 提交 MR, 而 测试 人 员 在 发 现 程 序 示 能 正 第 运行 的 时 候 也 可 以 提交 MR。 如 琳 
古 程 序 员 提 交 的 MR, 那么 在 提交 之 后 他 可 能 马上 就 可 以 进行 修改 。 也 有 可 能 MR 提交 之 后 会 经 过 
数 小 时 其 至 数 天 的 时 间 才 正式 开始 修改 , 而 且 还 有 可 能 不 直接 由 提交 者 来 修改 ， 当 提交 人 古 测 试 
人 员 的 时 候 尤 是 如 此 。MR 将 记录 关于 修改 的 一 切 信息 , 包括 MR 在 提交 和 实施 时 项 目 所 处 的 阶段 
以 及 日 期 、 提 交 人 以 及 实施 者 的 身份 、 用 于 摘 述 MR 的 相关 标签 信息 以 及 提交 人 和 实施 者 对 这 个 
(EB CFF 

MR 还 将 记录 实际 的 修改 ， 这 些 信息 将 由 这 个 工具 的 版 本 控制 组 件 记 录 ， 以 便 可 以 将 系统 恢 
复 到 开发 生命 周期 的 任意 时 间 扣 上。 所 有 这 些 MR 信 息 都 储存 在 数据 库 中 ， 我 们 的 故障 预测 工具 
只 需要 利用 这 些 信 息 来 分 析 过 去 的 版 本 就 能 预测 未 来 版 本 中 可 能 出 现 的 故障 。 

虽然 我 们 研究 的 系统 都 使 用 了 同一 个 工具 来 记录 MR， 但 是 每 个 系统 的 使 用 方式 又 可 能 有 所 
不 同 。 最 大 的 不 同 在 于 项 目 从 哪个 开发 阶段 开始 要 求 所 有 的 修改 邦 必 须 通 过 MR 的 记录 。 通 肖 的 
做 法 是 在 进入 系统 测试 阶段 之 后 才 要 求 用 MR 来 记录 修改 ,也 就 症 说 MR 数据 库 不 记录 系统 测试 之 
前 产生 的 修改 或 者 发 现 的 问题 。 我 们 研究 的 6 个 系统 中 有 4 个 采用 了 这 样 的 做 法 。 对 这 4 个 系统 来 
说 , 我 们 希望 我 们 的 模型 可 以 预测 系统 测试 以 及 正式 发 布 使 用 阶段 的 故障 ， 因 为 模型 是 基于 这 些 
阶段 以 往 的 错误 建立 鸭 。 

此 外 , 库存 管理 系统 记录 了 从 单元 测试 开始 的 所 有 开发 阶段 (包括 后 面 的 系统 济 试 以 及 正式 
发 布 使 用 ) 中 发 现 和 修正 的 故障 。 这 个 系统 的 故障 约 有 80% 是 在 单元 视 试 和 集成 测试 阶段 发 现 的 
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( 即 在 系统 测试 阶段 之 前 发 现 的 ), 所 以 其 平均 故障 数量 相 比 其 他 系统 要 高 。 这 就 解释 了 为 什么 库 
存 管 理 系 统 的 故 隐 看 上 去 要 比 其 他 任何 系统 都 要 多 很 多 。 数 量 多 并 不 一 定 就 表明 这 个 系统 的 问题 
比 其 他 系统 更 多 。 

语音 应 答 系 统 生 一 个 特例 ， 我 们 将 在 下 一 区 进行 讨论 。 


9.2 ”故障 高 发 文件 的 特征 


在 证 明 故 障 具有 集中 性 之 后 , 我 们 就 开始 分 析 这 些 频频 出 现 赦 障 的 代码 和 文件 到 底 有 些 什么 
特征 ， 以 便 以 后 可 以 更 好 地 进行 识别 。 处 在 开发 阶段 的 软件 有 两 种 属性 可 以 帮助 我 们 分 析 代 码 。 
第 一 种 是 可 以 直接 从 源 代 码 中 提取 出 来 的 静态 代码 结构 属性 。 这 些 属 性 包括 编程 语言 、 文 件 的 代 
码 行 数 、 方 法 调用 次 数 以 及 各 种 复杂 度 指标 。 

第 二 种 是 流程 相关 的 属性 ， 比 如 和 系统 的 开发 测试 过 程 相关 的 一 些 属性 。 比 如 : 前 个 版 本 中 
发 现 的 修改 以 及 故障 数量 、 示 个 部 分 的 代码 在 系统 中 存在 的 时 间 等 。 

我 们 早期 研究 的 目标 是 分 析 故 障 文件 的 这 两 种 属性 , 并 从 中 找 出 和 故障 的 发 生 密切 相关 的 属 
性 和 特征 。 我 们 研究 的 前 两 个 系统 提供 了 足够 的 证 据 ， 使 我 们 可 以 构建 一 些 急 级 模型 。 而 这 些 模 
型 都 较为 成 功 地 预测 了 哪些 文件 在 这 两 个 系统 未 来 版 本 中 节 多 发 生 故障 。 

我 们 研究 的 第 三 个 系统 ， 即 语音 应 答 系 统 ， 虽然 和 前 两 个 系统 在 规模 、 正 式 发 布 使 用 的 时 间 
以 及 开发 人 员 数 量 上 都 差不多 , 但 古 其 使 用 的 开发 流程 阶段 的 划分 和 发 布 时 间 间 隔 却 和 第 见 的 不 
同 。 我 们 无 法 对 这 个 系统 的 故障 及 其 开发 阶段 做 关联 。 

这 个 语 首 应 答 系 统 的 发 布 是 不 间断 的 ， 任 何 时 候 只 要 修复 了 bug 或 者 添加 了 新 功能 ， 就 会 发 
布 一 个 版 本 。 由 于 这 个 系统 没有 定期 发 布 新 版 本 的 制度 ,而且 也 没有 相应 充分 的 系统 测试 ， 我们 
也 不 清楚 基于 前 两 个 系统 有 的 模型 是 任 也 适用 于 这 个 系统 ， 但 十 我 们 却 慰 喜 地 发 现 虽然 各 有 差异 ， 
但 是 这 些 模型 的 表现 邦 非 第 好 。 表 9-1 和 表 9-2 中 展示 的 所 谓语 音 应 答 系统 的 各 个 “版 本 ”实际 上 
只 是 截取 了 这 个 系统 的 生命 周期 中 连续 的 三 个 月 里 所 发 布 的 版 本 ， 而 相关 的 bug 也 是 指 在 这 三 个 
月 内 首次 发 现 的 pug。 开 发 模式 上 的 不 同 可 能 是 造成 这 个 系统 每 个 版 本 的 故 隐 比 其 余 大 多 数 项 目 
邦 要 多 有 的 原因 。 这 个 项 目的 很 多 MR 邦 是 记录 开发 人 员 在 模块 开发 较 早 时 期 所 做 的 修改 ， 这 对 应 
了 传统 项 目的 单元 测试 阶段 。 

基于 我 们 对 前 三 个 系统 的 实验 ,我们 确定 了 一 个 标准 的 预测 模型 ,并 对 三 个 维护 支持 系统 进 
行 了 预测 ， 结 采 极 好 。 


9.3 FRM RA oT 


要 想 预 测 茶 个 系统 在 第 N 个 版 本 中 的 故障 ， 我 们 就 必须 分 析 早 前 版 本 中 的 代码 特质 、 流 程 特 
质 以 及 故障 数量 ， 并 生成 相应 的 模型 。 这 个 方法 的 基本 前 可 假设 是 : 在 早 前 版 本 中 和 故障 文件 紧 
窗 相 关 的 特质 ， 在 后 续 的 版 本 中 也 会 保持 这 种 相关 性 。 预 测 模 型 由 一 个 方程 式 组 成 ,而 其 中 的 变 
量 则 是 版 本 N 中 的 文件 的 代码 和 流程 特质 ， 得 出 的 结 末 则 古 这 个 文件 的 预测 故障 数 量 。 要 创建 模 
型 最 少 必须 要 有 两 个 早 前 版 本 的 数据 ， 上 不 封 项 。 用 于 建立 模型 的 数据 我 们 称 之 为 养 成 数据 
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(training data) 。 

因为 可 以 得 到 这 些 系 统 的 所 有 历史 故障 数据 ， 所 以 可 以 利用 从 版 本 1 到 版 本 N 一 1 的 信息 来 生 
成 版 本 N 的 预测 模型 ， 然 后 再 查看 版 本 N 的 实际 故障 分 布 来 检查 预测 结果 的 准确 度 。 我 们 评估 预 
测 结 果 的 方法 是 检查 排 在 预测 列表 前 20% 的 文件 中 包含 的 故障 数量 。 表 9-2 显 示 ， 前 20% 的 文件 中 
至 少 包 含 了 75% 的 故障 ， 大 部 分 时 候 这 个 比率 其 至 超过 了 80%。 这 个 表 有 力 地 证 明了 这 个 预测 方 
法 也 适用 于 其 他 的 大 型 项 目 。 

你 可 能 会 好 奇 ， 为 什么 会 选择 一 个 看 似 随 机 的 比率 20% 来 评估 预测 结果 呢 ?” 原 因 有 两 个 。 首 
先 ， 我 们 和 其 他 研究 人 员 的 研究 都 表明 ， 绝 大 部 分 的 故障 都 存在 于 故障 最 多 的 那 20% 的 文件 中 ， 
这 使 我 们 认为 : 如 果 预 测 出 的 文件 包含 了 80% 的 故障 ， 那 么 “ 找 出 故障 频 发 的 文件 ”这 个 任务 就 
AEM T o 

其 次 , MOE BLA20%i TH DAKE , 这 样 我 们 想 要 重点 关注 故障 文件 的 想法 才能 得 以 实施 。 
当然 ， 并 不 是 说 其 他 的 文件 束 不 值得 仔细 测试 或 者 检查 了 ， 只 是 说 那 20% 的 文件 可 能 会 需要 额外 
的 关注 。 

我 们 使 用 的 这 些 预测 模型 都 基于 人 负 二 项 式 回 归 分 析 (Negative Binomial Regression ， 下 称 
NBR) 中， 因为 这 是 我 们 找到 的 针对 这 次 研究 最 有 效 的 统计 方法 。 我 们 建立 了 NBR 模 型 的 一 种 形 
式 ， 并 成 功 地 将 其 应 用 到 了 很 多 不 同 的 系统 中 。NBR 是 一 种 广为人知 的 统计 建 模 方法 ,也 是 线性 
回归 的 扩展 。NBR 尤 其 适用 于 计算 结果 是 非 负 整数 的 情况 ,如 预测 软件 系统 中 某 个 文件 的 故障 数 
量 。NBR 的 模型 将 计算 结果 的 对 数 〈 即 预计 故障 数 ) 视 为 多 个 独立 变量 的 线性 组 合 。 换 言 之 ， 
NBR 假 定 预 计 故 障 数 是 这 些 独 立 变量 的 积 性 图 数 。 

下 列 这 些 标量 组 成 了 我 们 所 说 的 预测 用 标准 模型 。 这 些 变 量 将 作为 每 个 文件 的 预测 模型 的 输 
入 数据 ， 然 后 预测 模型 将 输出 该 文件 在 版 本 N 中 的 预测 故障 数量 。 

O 文件 大 小 : 文件 中 的 代码 行 数 (LOC) 

O 文件 是 前 一 个 版 本 就 存在 还 是 新 加 入 这 个 版 本 (二 选 一 )。 

O 在 版 本 N 一 1 中 该 文件 的 修改 次 数 。 

O 在 版 本 N 一 2 中 该 文件 的 修改 次 数 。 

O 该 文件 在 版 本 N 一 1 中 所 检测 出 的 故障 数量 ， 无 论 是 在 测试 还 是 发 行 后 检测 出 。 

O 文件 所 使 用 的 编程 语言 。 

如 需 标 准 的 NBR 模 型 的 详细 技术 说 明 ， 请 参见 Weyuker 等 人 的 报告 ”。 

在 我 们 的 实验 中 , 我 们 用 预测 故障 最 频 发 的 20% 的 文件 在 当前 版 本 中 所 包含 的 实际 故障 数量 
除 以 该 版 本 的 实际 故障 总 数 ， 这 样 束 能 看 出 模型 的 预测 结果 有 多 成 功 。 也 就 是 说 ， 如 果 我 们 预测 
的 故障 最 频 发 那 20% 的 文件 包含 了 80 个 故障 ,而 版 本 N 的 故障 总 数 为 100, 那 我 们 就 可 以 说 我 们 的 
模型 准确 地 在 20% 的 文件 中 识别 出 80% 的 错误 。 当 然 ， 当 我 们 在 正在 进行 的 开发 环境 中 应 用 这 些 
模型 的 时 候 ， 开 发 人 员 并 不 知道 版 本 N 中 具体 有 哪些 文件 会 被 预测 为 故障 频 发 。 


9.4 ”预测 模型 的 复 验 和 变 体 
我 们 必须 在 不 同 的 项 目 中 重复 这 些 实验 , 才能 证 明 这 个 方法 有 效 。 对 于 实验 对 象 系统 的 相同 
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版 本 采取 相同 的 统计 模型 一 般 来 说 无 法 给 出 什么 新 的 信息 ， 因 为 我 们 采用 的 预测 算法 是 确 定性 
的 。 因 此 ， 此 处 所 说 的 重复 实验 指 的 是 要 么 对 同一 系统 的 不 同 版 本 应 用 同样 的 模型 ， 要 么 对 多 个 
不 同 的 系统 使 用 同样 的 模型 。 

两 种 重复 实验 我 们 都 已 做 过 。 在 表 9-1 中 ， 我 们 展示 了 在 研究 中 研究 过 的 各 系统 版 本 数量 。 
在 这 一 三 中 ， 我 们 将 讨论 男 一 种 形式 的 重复 实验 ， 即 使 用 模型 变 体 。 

虽然 上 一 市 中 介绍 的 NBR 模 型 已 经 达到 了 很 高 的 准确 率 , 但 我 们 还 古 继续 研究 了 可 能 的 改进 
Ds 

在 研究 中 , 我 们 尝试 在 NBR 中 代入 不 同 的 变量 , 还 用 NBR 和 其 他 统计 模型 做 了 对 比 。 这些 实 
验 表 明 , 想 要 在 标准 NBR 模 型 的 基础 上 再 进行 改善 非 第 困难 。 我 们 使 用 额外 的 变量 来 增加 准确 率 
的 收获 最 多 不 过 约 1%， 而 没有 任何 的 其 他 统计 学 模型 能 得 出 比 NBR 模 型 更 准确 的 结 坟 。 

这 样 ， 除 了 对 改进 预测 的 方法 进行 了 探索 以 外 ,这 些 实验 还 可 以 作为 一 个 旁证 ,证 明 我 们 的 
故障 预测 方法 确实 是非 剃 健全 的 。 


9.4.1 开发 人 员 的 角色 


很 多 软件 开发 人 员 相 信 , 对 于 软件 质量 和 错误 预测 来 说 , 很 重要 的 一 上 扣 古 谁 或 者 有 多 少 人 最 
近 修 改过 代码 。 他 们 通 第 认为 ， 修 改 某 段 代码 的 程序 员 越 多 ， 这 段 代码 就 越 容易 出 bug。 当 我 们 
展示 我 们 的 预测 方法 以 及 标准 NBR 模 型 的 时 候 , 最 第 被 问 到 的 一 个 问题 就 是 在 模型 中 代入 编写 和 
修改 代码 的 程序 员 的 信息 会 不 会 让 预测 的 结 来 更 加 准确 。 为 此 ， 我 们 决定 对 标准 模型 进行 扩充 ， 
加 入 开发 人 员 的 信息 ， 并 将 结 末 和 不 加 入 这 些 信息 的 标准 模型 得 出 的 结 采 进行 对 比 。 
MR 的 数据 库 中 包含 了 每 个 版 本 中 的 每 个 文件 的 每 次 文件 修改 所 对 应 的 开发 人 员 ID。 这 让 我 
们 可 以 找 出 从 头 到 尾 有 哪些 开发 人 员 修 改过 这 个 文件 。 可惜 的 古 , 数据 库 中 并 没有 首次 创建 这 个 
文件 的 开发 人 员 人 信息。 尽管 如 此 ， 这 些 ID 还 是 让 我 们 可 以 在 预测 模型 中 加 入 下 面 三 个 变量 。 
eHUUUUUL 
从 版 本 1 到 版 本 N 一 1 有 多 少 个 开发 人 员 修 改过 这 个 文件 。 
esUUUUUUDO 
版 本 N 一 1 中 有 多 少 个 开发 人 员 修改 过 这 个 文件 。 
e O00000 
在 版 本 N 一 1 中 有 多 少 个 开发 人 员 征 首次 修改 这 个 文件 。 


虽然 在 单独 加 入 每 个 开发 人 员 相 关 的 变量 时 ,预测 的 结 采 都 只 会 得 到 少许 改善 ,但 是 素 积 开 
发 人 员 数 的 改善 总 是 相对 最 大 。 所 以 , 我们 只 展示 了 这 个 变量 的 结 采 ， 并 将 这 些 结 末 和 原版 的 标 
人 难 NBR 模 型 的 结 未 进行 对 比 。 

图 9-1、 图 9-2 和 图 9-3 分 别 展示 了 维护 系统 A、B、C 的 信息 。 这 些 数 字 最 惫 刊载 在 Weyuker 等 
人 "的 报告 中 。 每 个 图 都 分 成 上 下 两 部 分 ， 并 按 版 本 号 对 齐 。 图 的 上 半 部 分 是 一 个 条 形 图 ， 展 示 
的 是 在 每 个 版 本 中 发 现 的 故障 上 总数。 可 以 看 出 ，bug 总 古 集 中 在 一 小 振 文 件 中 。 
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A 系统 








图 9-1 加 入 与 不 加 入 蛇 积 开发 人 员 数 的 预测 结果 对 比 : 系统 A 中 按 版 本 号 分 类 的 前 
20% 文 件 中 的 故障 数 和 故障 率 


B 系 统 


OP ODA -_9-.0--1-0 OOO 


Wl 








图 9-2 MASGAIA BARRA AB TMM ZEA TLE: 系统 B 中 按 版 本 号 分 类 的 前 
20% 文 件 中 的 故障 数 和 故障 率 
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图 9-3 ”加 入 与 不 加 入 累积 开发 人 员 数 的 预测 结果 对 比 ， 系统 C 中 按 版 本 号 分 类 的 前 
20% 文 件 中 的 故障 数 和 故障 率 


图 的 下 半 部 分 包括 了 两 根 线 , 用 于 对 比 标准 模型 和 用 累积 开发 人 员 数 扩充 过 的 模型 的 成 绩 对 9 
比 。 两 根 线 都 表示 在 预测 出 的 故障 频 发 的 那 20% 的 文件 中 实际 包含 的 故障 占 总 故障 的 百分比 ， 

我 们 可 以 看 到 加 或 者 不 加 开发 人 员 信息 实际 上 并 没有 多 大 差别 。 拿 系统 A 来 说 ， 预 测 改善 的 
平均 值 只 有 0.2%， 而 对 于 系统 C 来 说 则 完全 没有 改善 。 其 至 对 于 改善 最 大 的 系统 B 来 说 ， 改 善 程 
度 也 只 有 灾变 的 1%。 此 外 ， 我 们 还 发 现 了 一 个 有 趣 的 现象 ， 那 就 是 这 三 个 系统 中 总 有 那么 一 个 
版 本 ， 添 加 了 开发 人 员 信息 反而 让 预测 的 准确 度 降低 了 。 

若 需 要 其 余 更 详细 的 研究 结果 ， 请 参见 Weyuker 等 人 的 报告 只。 


9.4.2 用 其 他 类 型 的 模型 来 预测 故障 


虽然 我 们 已 经 确定 NBR 模 型 可 以 识别 出 包含 了 绝 大 部 分 故障 的 一 小 撮 文 件 , 但 是 我 们 仍然 想 
要 将 这 个 模型 和 其 他 的 模型 的 结果 进行 对 比 。 我 们 使 用 了 3 中 不 同 建 模 方法 : 递归 分 组 、 随 机 森 
林 以 及 贝 叶 斯 加 性 回归 树 (Bayesian Additive Regression Trees， 下 称 BART)， 来 为 表 9-1 中 的 3 个 
系统 创建 了 模型 。 随 机 和 森林 和 BART 是 递归 分 组 的 扩展 ， 用 于 解决 递归 分 组 的 局 限 性 。 

递归 分 组 基于 养 成 数据 来 构造 二 元 决策 树 ， 如 此 ， 每 个 时 于 点 都 代表 了 一 组 相似 的 输入 值 ， 
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这 些 输 入 值 所 对 应 的 输出 值 ( 即 故障 预测 数 ) 相互 比较 接近 。 我 们 可 以 这 样 来 理解 这 个 树 ， 首 先 
我 们 的 目的 是 为 新 版 本 中 的 每 个 文件 预测 故障 的 数量 。 预 测 流 程 的 输入 是 文件 , 而 输出 则 是 预测 
的 故障 数量 。 

每 个 文件 都 带 有 一 系列 的 属性 ， 包 括 其 长 度 、 故 障 及 修改 历史 、 编 程 语言 等 。 这 些 属性 都 是 
预测 流程 的 独立 变量 , 或 称 预 测 指 标 变 量 。 决策 树 将 用 这 些 属性 值 来 为 每 个 文件 分 别 定 义 一 条 从 
根 市 点 到 子 市 点 的 路 任 。 树 的 每 个 内 部 证 点 都 将 基于 每 个 预测 指标 变量 的 值 把 输入 分 成 两 组 ,该 
输入 值 将 按照 该 市 点 所 对 应 的 指标 变量 选择 左 分 支 或 者 右 分 文 进行 下 一 步 。 当 输入 值 达 到 叶 市 点 
的 时 候 ， 甚 预测 故障 数 则 是 根据 该 节点 上 的 所 有 养 成 数据 所 得 出 的 平均 故障 数 。 

树 的 构造 是 从 上 到 下 的 , 首先 是 将 所 有 的 养 成 数据 分 为 两 组 ,分 组 将 基于 单独 的 一 个 指标 变 
量 , 这 个 变量 必须 保证 每 组 内 的 数据 的 均 方 误差 降 到 最 低 。 每 个 文件 的 养 成 数据 的 误差 束 是 该 文 
件 的 故障 数 和 该 市 点 的 平均 故障 数 的 差距 。 每 次 分 组 产生 的 市 点 又 会 再 被 分 成 两 组 , 分 组 同样 基 
于 均 方 误差 最 低 的 单个 变量 。 这 样 的 递归 分 组 将 不 断 重 复 ， 直 到 满足 某 个 停止 条 件 。 

由 于 递归 分 组 和 回归 分 析 的 理念 完全 不 同 , 所 以 这 样 的 方法 产生 的 模型 和 负 二 项 式 产 生 的 模 
型 有 很 大 不 同 。 

递归 分 组 有 个 缺点 ， 那 就 是 决策 树 的 构造 非常 依赖 最 早 的 儿 次 分 组 ,一旦 养 成 数据 被 分 配 到 
了 树 的 其 一 边 , 这些 数 据 就 无 法 再 关联 到 树 的 男 一 边 了 ,而 男 一 边 可 能 正好 有 非常 接近 的 故障 数 。 
这 个 问题 由 随机 森林 来 解决 , 方法 是 创建 一 大 堆 决 策 树 ， 并 用 这 些 树 的 平均 预测 来 作为 输出 。 我 
们 的 每 个 故障 预测 森林 中 都 包含 500 棵 决策 树 。 很 明显 ， 随 机 和 森林 所 需要 的 时 间 要 比 NBR 或 者 递 
归 分 组 的 时 间 更 多 一 些 。 

我 们 使 用 的 最 后 一 种 方法 称 之 为 贝 叶 斯 加 性 回归 树 (BART) 。 这 个 方法 解决 递归 分 组 问题 的 
方法 是 将 预测 分 成 小 块 ， 并 分 别 对 它们 进行 递归 树 的 流程 ， 最 后 再 把 结果 汇总 。 我 们 在 使 用 这 种 
方法 的 时 候 ， 在 每 个 预测 模型 中 都 使 用 了 100 棵 递归 树 。 

澡 需 了 解 这 些 方法 的 详细 信息 以 及 我 们 在 使 用 这 些 方法 的 过 程 中 所 发 现 的 一 些 局 限 性 问题 ， 
请 参见 Weyuker 等 人 的 报告 “。 我 们 使 用 了 R[R Project Statistical Computing] 程 序 库 中 对 这 种 三 种 
方法 的 实现 来 构建 这 些 模 型 并 进行 预测 : rpart 包 [rpart Package] 对 应 递归 分 组 模型 ，randomForest 
包 [randomForest Package] 使 用 的 是 随机 森林 来 预测 ， 而 BayesTrees 包 [BayesTree Package] 则 是 用 
BART 模 型 来 预测 。 

我 们 这 次 模型 比较 实证 研究 的 对 象 分 别 是 维护 支持 系统 A、B 和 C， 结 末 如 表 9-1、 表 9-2 及 图 
9-4 所 示 。 这 些 结果 取 自 于 Weyuker 等 人 的 原 论文 “， 展 示 的 是 这 几 种 预测 模型 找 出 的 20% 故 障 最 
多 发 的 文件 中 所 包含 的 故障 百分比 。 条 状 图 表示 的 是 我 们 所 预测 过 的 系统 的 各 版 本 平均 值 。 图 表 
显示 ， 对 于 这 三 个 系统 来 说 ，NBR 和 随机 森林 模型 的 效果 比 BART 和 递归 分 组 模型 要 好 很 多 。 虽 
然 NBR 和 随机 数 模 型 的 预测 结果 并 没有 统计 学 意义 上 的 差别 , 但 是 前 者 所 需要 的 时 间 却 比 后 者 要 
少 很 多 。 所 以 ， 我 们 认为 至 少 对 于 这 些 系统 来 说 ，NBR 是 最 好 的 选择 。 





























96 —# eS 115 


100 


~~ oo \O 
© © © 


前 20% 文 件 平均 错误 率 


CN 
© 





50 
A 系 统 B 系 统 C 系 统 





国 NBR Ore Ore 口 BART 


图 9-4 ”四 种 不 同 模型 的 预测 结 末 ， 和 针对 系统 A、B、C 


9.5 工具 的 设计 


由 于 我 们 的 标准 NBR 的 预测 能 力 已 经 被 证 实 , 而 参与 者 又 都 想 要 在 实际 项 目 中 使 用 我 们 这 项 
BOR, 所 以 我 们 决定 设计 一 套 自动 化 编程 环境 工具 , 让 用 户 可 以 为 即将 进入 系统 测试 阶段 的 文件 
生成 下 一 版 的 故障 预测 结 来 。 

我 们 做 了 一 个 可 使 用 的 原型 工具 , 这 个 工具 只 需 很 少 的 专业 知识 或 者 用 户 输 入 。 用 户 需 要 指 
出 需要 进行 预测 的 系统 中 正在 开发 的 版 本 ， 以 及 需要 做 预测 的 文件 类 型 。 此 外 ， 用 户 需 要 告诉 这 
个 工具 如 何 来 识别 保存 故障 修复 历史 数据 的 MR 数据 库 中 的 条 目 ,故障 的 识别 信息 要 么 就 包括 MR 
所 处 的 开发 阶段 ， 比 如 系统 测试 阶段 ， 或 者 就 包括 MR 的 发 起 人 ， 比 如 系统 测试 人 员 。 

这 个 工具 返回 结果 的 形式 是 一 系列 的 文件 , 这 些 文件 将 按照 预测 故障 数 降序 排列 。 用 户 可 以 
指定 想 要 碍 看 故障 最 多 发 的 文件 的 百分比 ,也 可 以 选择 只 查看 某 一 类 型 的 文件 。 比 如 说 , 用户 可 
以 只 碍 看 问题 最 多 的 10% 的 Java 文 件 ， 或 者 查看 问题 最 多 的 20% 的 C、C++、Java 或 SQL 文件 。 预 
测 结 采 的 生成 一 般 来 说 非常 地 快 。 

用 户 无 需 任 何 数据 挖掘 算法 或 者 统计 学 的 知识 , 也 不 必 对 这 个 工具 的 工作 原理 进行 了 解 , A 
接 就 可 以 使 用 这 个 工具 。 

我 们 的 不 少 开发 和 测试 经 理 都 已 经 看 过 了 这 个 工具 原型 的 实际 运作 过 程 , 他 们 都 布 望 能 使 用 
这 个 技术 来 为 他 们 的 软件 系统 做 预测 ， 以 便 能 指导 需求 和 设计 的 审查 和 帮助 测试 工作 。 

9.6 一 些 忠 告 


— Ww A 


在 设计 我 们 的 故障 预测 技术 和 工具 的 过 程 中 , 我 们 做 了 大 量 的 实证 研究 。 由 于 在 商业 环境 中 
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很 少见 到 针对 多 个 系统 反复 进行 的 跨越 数 年 的 实证 研究 , 所 以 我 们 认为 读者 也 许 会 想 了 解 在 这 个 
过 程 中 哪些 部 分 是 最 困难 的 以 及 造成 困难 的 原因 , 这 样 他 们 就 能 理解 为 什么 这 样 的 证 据 虽 然 很 难 
搜集 ， 但 是 却 至 关 重 要 。 


esUUUUUUUOUOOUDO 

很 多 读者 可 能 会 觉得 , 你们 不 古 为 一 个 大 公司 工作 吗 , 你 们 的 公司 不 是 有 数 以 亿 计 其 至 
十 亿 记 的 代码 同时 运行 吗 , 找 个 系统 来 研究 还 不 容易 ”但 事实 并 非 想 象 的 那么 简单 ,尤其 是 
在 研究 的 初期 。 这 有 护 类 似 于 先 有 鸡 还 古 先 有 乍 的 问题 。 系统 的 省 理 者 们 不 愿意 让 人 人 研究 他 
们 的 系统 ， 并 且 在 他 们 看 来 ， 这 样 做 的 理由 有 很 多 。 

首先 他 们 需要 担心 的 古 你 会 占用 他 们 的 时 间 , 而 他 们 的 项 目 又 常 弟 是 迫在眉睫 。 如 琳 他 
们 化 时 间 来 回答 你 的 问题 ,对 他 们 来 说 并 疫 有 直接 的 好 处 , 但 是 却 有 可 能 使 他 们 无 法 按时 部 
署 软件 系统 。 所 以 他 们 不 愿意 参与 到 研究 中 来 ， 因 为 他 们 和 贫 得 这 个 事情 征 个 风险 很 高 的 研究 
项 目 。 很 多 人 研究 项 目 确实 古 高 风险 的 ， 因 为 这 些 项 目 停留 在 了 理论 阶段 ,参与 者 无 法 利用 研 
究 的 结 来 。 

管理 者 们 还 担心 侯 究 人 员 会 修改 系统 或 者 数据 , 然后 对 项 目 造 成 不 民 的 影 啊 。 虽然 我 们 
可 以 保证 只 看 不 磁 ， 但 是 他 们 还 古 会 担心 你 会 有 意 或 无 意 地 影响 他 们 的 系统 。 

和 其 他 领域 的 研究 类 似 ， 我们 的 研究 还 有 一 个 问题 。 比 如 ,在 医疗 或 者 药品 实验 中 ， 作 
为 研究 对 象 的 人 们 很 少 能 从 研究 中 得 到 好 处 ,不 但 如 此 ,他 们 还 必须 被 告知 参与 所 可 能 市 来 
的 风险 。 

实际 上 , 我 们 的 最 早 的 参与 者 们 实际 上 并 没有 歼 得 任何 好 处 ,因为 我 们 只 是 在 寻找 和 故 
障 高 发 文件 联系 最 紧密 的 各 类 特征 ， 而 预测 模型 的 设计 也 刚刚 开始 。 

即使 在 我 们 有 了 一 个 看 上 去 成 功 的 预测 模型 之 后 , 也 还 古 需 要 儿 个 系统 来 做 验证 。 在 验 
证 完成 之 后 , 我 们 才 开 始 创建 一 套 目 动 化 工具 。 在 这 个 工具 开发 完成 之 前 ， 要 做 预测 就 必须 
了 解数 据 挖掘 和 统计 学 的 相关 知识 ， 还 必须 对 统计 工具 (如 R) 有 一 定 了 解 。 这 已 经 超出 了 
普通 软件 开发 人 员 以 及 测试 人 员 的 能 力 范 围 。 

一 旦 你 用 这 个 技术 预测 成 功 过 几 次 了 之 后 ， 想 要 找 项 目 来 参与 赋 究 就 不 难 了 ， 当 然 , 首 
先 还 是 要 有 一 些 有 奉献 精神 并 且 甘 当 小 白 妃 的 项 目 。 这 通常 需要 你 和 项 目 人 员 在 文 前 的 工作 
中 建立 的 恨 好 关系 ,以 此 来 说 服 他 们 你 了 解 项 目 在 时 间 上 的 限制 , 还 有 就 是 你 了 解 在 研究 过 
程 乙 中 绝 不 能 影响 项 目 。 

e UUUOUUUOUOUOODDDDD 

正如 前 面 所 说 的 ,在 我 们 正式 研究 故障 预测 之 前 , 我们 还 必须 确认 故障 不 古 均匀 分 布 的 ， 
还 得 确定 哪些 特征 和 故障 文件 的 关系 最 紧密 ， 这 些 都 需要 做 很 多 预备 研究 。 当 然 ， 我 们 可 以 
用 很 多 坊间 经 验 来 作证 , 尤其 是 证 明和 帕 素 托 分 布 相 关 的 假说 ,而 且 早 前 已 经 有 一 些 研究 疮 
虑 了 和 高 故障 率 相 关 的 因素 , 但 是 个 人 经 验 并 不 能 和 对 大 型 商业 系统 进行 的 专业 人 研究 相 提 并 
w. 我们 必须 在 人 研究 的 环境 中 确认 我 们 能 观察 到 这 一 现象 。 最后， 对 不 同 特征 的 重要 性 所 做 
的 早期 研究 中 ,， ALE SARA, 而 有 的 根本 没有 把 代码 相关 特征 以 及 历史 相关 特征 
ADAG EEK 
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我 们 大 概 伦 了 两 年 时 间 来 做 这 些 预备 研究 , 然后 我 们 才 和 觉得 准备 好 为 第 一 个 系统 构建 统 
计 预 测 模型 。 
-DOUO0UD0U0UU0UU0UUUUD 

当 我 们 确定 了 最 关键 的 代码 及 历史 特征 之 后 , 我 们 还 必须 了 解 软件 系统 所 使 用 的 变更 管 
理 和 版 本 控制 系统 ， 并 确定 如 何 来 所 取 必 要 的 数据 。 在 研究 第 二 个 系统 的 过 程 中 ,我 们 发 现 
即便 古 同 一 个 数据 字段 ， 不 同 的 系统 也 有 着 不 同 的 使 用 方式 ， 或 者 有 时 候 使 用 得 并 不 到 位 。 
这 有 助 于 我 们 确定 哪些 数据 有 用 ,哪些 没 用 。 随 后 , 我们 需要 编写 一 些 脚 本 来 执行 数据 提取 
的 工作 ， 并 建立 原始 预测 模型 。 
如 此 ,又 花 了 一 年 时 间 之 后 ,我 们 才 终 于 能 够 用 定制 的 预测 模型 对 第 一 个 系统 进行 切 步 预测 。 


e DDOUDU0UUDUUUUD 

我 们 的 模型 将 为 每 个 文件 关联 下 一 版 本 的 预测 故障 数 。 我 们 考虑 了 多 个 方法 来 评 断 这 些 
PRM AG AEP A. 

一 种 方法 起 直接 对 比 每 个 文件 的 预测 故障 数 和 实际 故障 数 。 就 我 们 研究 的 第 一 个 系统 来 
说 ， 两 个 数字 并 不 紧密 匹配 。 然 而 ， 文 件 故 障 数 的 相对 顺序 却 常 芝 是 非常 相似 的 。 在 和 项 目 
人 员 们 讨论 之 后 ， 我 们 发 现 最 好 的 评 佑 办 法 是 如 本 草 早 前 所 说 的 前 20% 的 文件 。 

我 们 考虑 了 多 种 在 其 他 研究 文献 提出 的 指标 , 但 是 最 后 发 现 这 些 指标 并 不 适用 于 我 们 的 
研究 ， 因 为 它们 古 设 计 用 于 预测 二 元 决策 (比如 一 个 文件 是 否 包 含 故 障 )， 而 不 古 像 我 们 的 
模型 那样 为 文件 进行 排序 。 我 们 继续 评估 了 多 种 可 选 的 评估 标准 ,以 确保 我 们 使 用 的 方法 最 
适合 于 我 们 的 需求 。 

e UDUD“UU OO0050 

我 们 完成 了 数 个 大 型 的 实证 研究 并 一 致 获得 民 好 结 末 ， 还 开发 了 一 整套 上 自动 化 的 工具 ， 
尽 省 如 此 ,我们 还 是 很 难说 服 项 目 领导 去 修改 开发 方法 并 在 开发 流程 中 融入 我 们 的 预测 模型 
和 工具 。 我们 最 近 找 到 了 一 个 项 目 , 这 个 项 目的 管理 层 认为 这 项 技术 非常 有 用 ,我 们 正在 讨 
论 把 技术 转让 给 他 们 。 使 用 这 些 工 具 会 否 影 响 用 户 识 别 故 障 的 类 型 以 及 数量 ， 还 有 待 观察 。 

那么 我 们 的 底线 古 什么 ”在 这 项 研究 上 ， 我 们 已 经 伦 了 8 年 时 间 。 有 必要 伦 那 么 多 时 间 
吗 ? 我 们 希望 本 革 中 谈 到 的 内 容 会 让 你 相信 人 花 这 些 时 间 是 非 第 值得 的 。 想 要 在 我 们 这 样 大 的 
泥 围 内 收集 证 据 通 冲 需 要 很 多 时 间 , 尤其 十 在 技术 正在 开发 和 成 熟 阶段 的 时 候 ， 因为 在 这 些 
阶段 的 大 部 分 事情 都 必须 人 手动 完成 。 不过, 现在 已 经 有 了 大 量 的 证 据 证 明 我 们 的 预测 模型 
足以 应 对 各 种 不 同 的 环境 和 条 件 ， 而 且 又 有 了 一 和 套 完全 目 动 化 的 工具 ,我 们 相信 ， 下 面 该 是 
它 光 它 四 射 的 时 候 了 了 ! 
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第 10 章 


淋 构 设计 的 程度 和 时 机 


Barry Boehm 


本 章 会 通过 介绍 一 些 研究 来 帮助 项 目 和 开发 组 织 确定 什么 时 候 该 使 用 敏捷 的 开发 方法 , 什么 
时 候 该 使 用 基于 架构 设计 的 开发 方法 。 虽 然 软件 及 软件 密切 相关 的 项 目的 管理 者 们 都 知道 架构 设 
计 很 重要 ， 但 是 他 们 手头 的 资源 都 很 有 限 ， 所 以 他 们 常 弟 会 同 :“ 到 底 架 构 设 计 要 做 到 什么 程度 
FNE?” (参见 10.2 市 。) 

本 草 总 结 概括 了 两 类 证 据 (这 些 证 据 古 由 我 和 其 他 的 研究 人 员 们 在 40 年 软件 实践 的 经 验 中 坚 
计 起 来 的 )， 以 便 能 为 有 上 述 疑 惑 的 管理 者 们 提供 一 些 实践 上 的 指导 方针 。 此 外 ， 我 们 还 将 讨论 
一 下 我 们 对 这 些 回 题 的 一 些 看 法 。 我 们 的 研究 想 要 回答 的 问题 可 以 概括 为 如 下 内 容 。 

口 随 着 项 目的 时 间 的 推移 和 规模 的 变 大 ， 你 修改 或 者 修正 缺陷 的 成 本 会 相应 地 增加 多 少 ? 

D 在 开始 正式 的 产品 开发 之 前 ， 你 应 该 投入 多 少 在 早期 架构 设计 以 及 实证 基础 上 的 项 目 回 

pa? 

TEACH, “FRR” HPA eta Aa PP ml EE SATE RIAA Sls, ete ra TP 
BUTANE ERE in RULER SMES , LOUD aa. APR SALA HT. ee 
本 分 析 、 需 求 及 架构 的 定义 .规划 和 调度 、 可行 性 的 确认 和 验证 等 一 一 即 《 系 统 架 构 设 计 》 (System 
Architecting) 一 书 中 的 对 于 架构 设计 的 定义 ”。 


10.1 修正 缺陷 的 成 本 是 否 会 随 着 项 目的 进行 而 增加 


对 于 我 们 第 一 个 问题 的 重要 性 ， 敏 捷 开 发 的 领军 人 物 Kent Beck 在 他 的 著作 《解析 极限 编程 》” 
(Extreme Programming Explained) 站 中 已 经 有 过 说 明 。 

图 10-1 展 示 的 是 “XP (极限 编程 ) 的 技术 前 提 ”。 如 果 对 软件 进行 修改 的 成 本 “ 随 着 时 间 的 
推移 而 缓慢 地 增长 …… 那 么 你 就 会 把 各 种 决策 尽量 推 后 …… 并 只 实现 你 需要 实现 的 。 

但 是 ,“ 如 末 局 平 的 成 本 曲线 意味 着 我 们 可 以 使 用 XP， 那 么 陡峭 的 成 本 曲线 则 意味 着 我 们 无 
法 应 用 XP。 








O 该 书 由 电子 工业 出 版 社 2006 年 出 版 。 一 一 编者 注 
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修改 成 本 


时 间 
10-1 修改 的 成 本 可 能 不 会 随 着 时 间 的 推移 而 急剧 上 升 


所 以 ， 我 们 可 以 问 : XP 或 者 其 他 的 敏捷 开发 方法 能 否 帮助 我 们 保持 修改 成 本 曲线 的 局 平 ? 
我 们 还 可 以 癌 : 还 有 没有 什么 别 的 办 法 可 以 让 成 本 曲线 局 平 化 , 以 便 项 目 后 期 的 修正 不 会 威胁 到 
项 目的 总 预算 和 交付 时 间 ? 还 有 就 是 ,对 于 那些 有 着 陡峭 成 本 曲线 的 项 目 来 说 ,如何 减 少 后 期 的 


修改 ?” 这 一 草 将 回答 这 些 问 题 。 
10.2 ”架构 设计 应 该 做 到 什么 程度 


如 果 说 陡峭 的 成 本 曲线 使 我 们 无 法 应 用 敏捷 的 开发 方法 (如 XP)， 那 么 在 项 目的 准备 阶段 我 
们 应 该 做 多 大 投入 ?有 的 决策 者 这 样 打 比 方 :“ 修 房子 的 时 候 ， 我 们 付 给 建筑 师 的 钱 差不多 等 于 
房子 价值 的 10%， 我 们 也 会 按照 同样 的 比例 付 给 软件 架构 师 。 但 是 到 底 百 分 之 多 少 对 于 软件 来 
说 才 是 合适 的 ? 10% 有 可 能 超出 太 多 ， 也 有 可 能 远 远 不 够 。 很 多 “ 铁 公 鸡 ” 决 策 者 认为 软件 染 构 
设计 并 不 直接 生成 软件 产品 ,所 以 会 尽量 减少 这 部 分 的 成 本 , 但 是 这 往往 会 寻 致 后 期 返工 的 增加 ， 
并 且 反 而 让 项 目的 时 间 和 成 本 超出 预算 。 这 样 看 来 ,任何 与 “架构 设计 应 该 做 到 什么 程度 ”相关 
的 证 据 对 于 企业 或 者 项 目 决 策 者 来 说 都 会 非常 有 价值 。 


成 本 -修正 增长 比 


在 20 世 纪 70 年 代 , 很 多 组 织 , ABM’, GTE", TRW” NIR REE H Safeguard H HP, 
都 对 大 型 软件 项 目 中 不 同 阶段 的 修改 (或 缺陷 修正 ) 的 成 本 做 了 研究 。 这 些 研 究 较为 一 致 地 表明 ， 
交付 后 的 修改 成 本 差不多 是 需求 确定 阶段 的 修改 成 本 的 100 倍 。 图 10-2 是 从 我 1981 年 的 书 《软件 
THAR) (Software Engineering Economics) “中 提取 出 来 的 ， 总 结 了 这 些 研 究 以 及 其 他 一 些 
相关 研究 的 结果 。 这 表明 ， 虽 然 对 于 大 型 系统 来 说 确实 是 有 100 : 1 的 比率 , 但 是 对 于 小 一 些 的 系 
统 (2000~ 5000 行 源 代 码 ) 来 说 ，5 : 1 的 比率 更 有 代表 性 门 。 














较 大 软件 项 目 
at IBM-SSD 


of GTE 


80% 

| 中 型 项 目 (TRW 调查 ) 
20% 

o——o SAFEGUARD 





] 
需求 操作 设计 编码 开发 接收 
缺陷 修改 的 阶段 


10-2 不 同 阶段 的 缺陷 修复 的 相对 成 本 〈20 世 纪 70 年 代 ) 


不 过 , 我 们 还 不 太 确定 对 于 这 些 影 响 成 本 的 因素 到 今天 还 会 不 会 有 同样 的 影响 。 为 了 探讨 这 
个 问题 以 及 一 些 相 关 的 其 他 问题 ,由 美国 国家 科学 基金 会 出 资 , 并 由 美国 马里 兰 大 学 和 南 加 州 大 
学 设立 的 实证 软件 工程 中 心中 的 有 相关 经 验 的 人 员 对 文献 进行 了 检索 , 并 组 织 了 三 个 在 线 学 术 讨 
论 会 中 ,这 些 研究 结果 基本 确认 了 大 型 项 目的 100 : 1 的 比率 ,实际 的 比率 在 117 : 1 和 137 : 1 之 间 ， 
而 另 一 份 1996 年 进行 的 研究 显示 ， 比 率 的 范围 在 70 : 1~ 125: 1 之 间 “1。 不 过 ， 相 关 的 学 术 讨 论 
会 的 讨论 结果 表明 , 在 大 型 项 目的 早期 需求 阶段 进行 的 投入 , 以 及 对 设计 的 确认 和 验证 可 以 把 成 
本 -修改 的 增长 曲线 从 100 : 1 降低 至 20 : 1。 有 一 个 成 功 的 案例 做 到 的 甚至 更 好 一 一 我 们 在 下 一 节 
将 会 介绍 一 个 百 万 行 的 大 型 CCPDS-R 项 目 , 据 我 所 知 这 个 项 目 是 唯一 一 个 符合 图 10-1 中 那 种 平稳 
Hee AP 

虽然 Beck 和 其 他 人 都 使 用 了 一 些 坊 间 数 据 来 证 明敏 捷 方 法 可 以 让 项 目 更 符合 图 10-1 那 样 的 
曲线 , 但 是 对 于 小 型 敏捷 项 目 进行 的 实证 研究 却 没 能 证 明 这 一 论断 。 最 近 一 份 针对 两 个 使 用 了 部 
分 XP 实践 (比如 结对 编程 、 测 试 先行 、 现 场 客 户 ) 并 且 未 违反 XP 的 其 他 实践 的 Java 商 业 项 目的 
实证 研究 提供 了 一 些 修 改 成 本 相关 的 实证 证 据 ， 如 图 10-3 和 图 10-4 所 示 |。 

虽然 在 这 些 研 究 中 没有 具体 的 修改 数量 以 及 每 个 修改 的 工作 量 的 信息 ， 但 是 我 们 从 项 目 1 中 
的 事例 (story) 总 工作 量 比率 中 还 是 能 看 出 ， 重 构 的 工作 量 的 每 事例 平均 增长 在 6% 左 右 (从 第 
一 个 事例 占 0% 的 工作 量 到 最 后 常 六 个 事例 完成 占 差 不 多 35% 的 工作 量 )， 而 解决 错误 的 工作 量 的 
增长 则 在 4% 左 右 ( 从 0% 到 最 后 大 概 占 25%)。 项 目 2 的 相应 数据 大 约 是 5% 和 3%。 这样 的 增 速 比较 
平稳 ， 虽 然 明 显 不 如 敏捷 的 行家 们 的 坊间 经 验 那么 夸张 ， 但 是 却 更 可 能 代表 了 使 用 XP 的 主流 经 
验 。 从 项 目 1 到 项 目 2， 增 速 有 所 放 缓 ， 这 意味 着 人 们 对 于 XP 有 着 可 觉察 但 是 并 不 特别 突出 的 学 
习 曲 线 效 应 。 
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项 目 1: 活动 增长 
© 解决 错误 m 新 设计 ~*~ BY 





事例 1 事例 2 事例 3 事例 4 事例 5 事例 6 
事例 


图 10-3 项 目 1: 修改 成 本 增长 图 


项 目 2: 活动 增长 
-解决 错误 全新 设计 ~ 全 重 构 


/SN Kd 


事例 1 ”事例 2 事例 3 事例 4 事例 5 事例 6 事例 7 
事例 


图 10-4 项 目 2: 修改 成 本 增长 图 


Reifer ”也 在 研究 中 引用 了 一 些 具有 类 似 特 点 的 私有 实证 数据 。 此 外 ， 我 们 还 从 Elssamadisy 
和 Schalliol 的 研究 ”中 关于 ThoughtWorks 公 司 的 XP 租 约 管理 器 项 目的 经 验 中 找到 了 一 些 佐证 。 当 
项 目的 规模 超过 50 个 人 、1000 个 事例 以 及 50 万 行 代码 的 时 候 ， 他 们 发 现 “ 虽 然 每 个 人 都 声称 这 些 
事例 卡片 上 的 任务 是 按时 完成 的 〈《 即 30 天 内 ) ， 但 是 实际 上 却 还 是 经 过 了 整整 12 个 星期 的 开发 才 
终于 可 以 交付 高 质量 的 应 用 程序 给 客户 ”。 
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10.3 ”架构 设计 的 成 本 -修复 数据 给 予 我 们 的 启示 


我 们 需要 在 项 目 最 初 就 把 架构 设计 独立 出 来 作为 一 系列 并 行 系统 以 及 项 目 定 义 , 以 便 确 定 它 
能 不 能 减少 后 期 的 返工 及 各 种 相关 项 目 成 本 。 在 这 一 习 中 , 我 们 将 展示 如 何 把 架构 设计 和 成 本 联 
系 在 一 起 , 并 在 本 全 后 面 的 部 分 继续 用 图 表 来 解释 何 时 做 架构 设计 , 以 及 在 不 同类 型 的 项 目 中 应 
该 把 染 构 设计 做 到 什么 程度 。 


10.3.1 关于 COCOMO ll 架构 设计 和 风险 解决 系数 的 基础 知识 


这 一 证 的 内 容 基 于 我 和 同事 们 的 一 份 长 期 研究 。 我 们 花 了 数 十 年 的 时 间 设 计 了 一 个 用 于 估算 
软件 项 目的 成 本 及 开发 时 间 的 模型 ， 我 们 称 之 为 建设 性 成 本 模型 (Constructive Cost Model, 
COCOMO)。 在 把 对 风险 的 评估 加 入 了 这 个 模型 之 后 ,我 们 成 功 地 展示 了 架构 设计 的 价值 以 及 在 
本 章 后 面部 分 将 会 详 述 的 “做 到 什么 程度 才 够 ”的 问题 。 

1. 规模 经 济 与 规模 不 经 济 

我 们 原始 的 COCOMOCD 模 型 中 并 没有 加 入 衡量 架构 设计 全 面 度 的 指标 , 因为 当时 我 们 没有 考 
虑 到 团队 是 否 能 处 理 好 规模 不 经 谤 的 问题 ， 而 大 多 数 团队 都 会 遇 到 这 个 问题 。 

那么 ， 到 底 什 么 是 规模 不 经 济 (还 有 规模 经 济 ) ? 这些 都 是 经 济 学 的 术语 ， 用 于 把 产品 的 产 
量 和 单位 成 本 联系 起 来 。 当 生产 更 多 的 产品 可 以 让 产品 的 单位 成 本 降低 时 ， 那么 我 们 说 这 是 规模 
经 济 。 反 之 ， 当 生产 更 多 的 产品 导致 单 位 成 本 升 高 时 ， 我 们 就 说 这 是 规模 不 经 济 。 

我 们 看 重 这 些 指 标的 原因 之 一 , 是 因为 软件 产品 现在 越 来 越 大 ,而 我 们 希望 能 够 尽量 减少 规 
模 不 经 济 。 另 外 一 个 原因 是 因为 软件 开发 人 员 和 硬件 开发 人 员 对 于 这 些 术语 有 着 截然 不 同 的 理 
解 。 硬 件 开 发 人 员 把 产品 看 做 像 车 或 者 手机 一 样 的 实体 : 生产 得 越 多 ,单位 成 本 自然 束 更 低 。 换 
句 话 说， 硬件 行业 一 般 属 于 规模 经 痢 。 对 于 软件 来 说 ,大 量 制造 副本 的 成 本 几乎 是 委 ， 而 真正 和 
成 本 相关 的 产量 单位 则 是 源 代 码 行 数 (SLOC) 。 就 这 个 产量 单位 来 说 ， 新 的 SLOC 越 多 ， 每 单位 
的 成 本 反而 越 高 ， 也 使 得 软件 项 目 稍 稍 会 遭遇 规模 不 经 济 。 

要 深究 其 原因 的 话 ， 我 们 可 以 考虑 一 下 创建 两 个 分 别 包 舍 10000 条 新 SLOC 的 软件 组 件 的 成 
本 。 如 有 果 开 发 成 本 是 $20/SLOC， 那 么 每 个 组 件 的 成 本 束 是 10000 x $20=$200000。 

但 是 如 果 我 们 要 把 这 两 个 组 件 组 合成 一 个 单独 的 产品 呢 ” 除 了 每 个 组 件 所 需 的 $200000 之 
外 ， 还 会 有 各 种 额外 的 开销 ， 比 如 让 它们 可 以 进行 交互 的 设计 成 本 ， 将 它们 整合 成 一 体 的 成 本 ， 
对 整合 后 的 系统 进行 测试 的 成 本 ， 以 及 解决 整合 后 可 能 的 各 种 缺陷 的 成 本 等 。 

虽然 说 交付 的 SLOC 仍 然 是 20000， 但 是 成 本 却 远 不 止 2 x $200000=$400000， 每 SLOC 的 成 本 
增加 了 ， 造 成 了 规模 不 经 济 。 软 件 开 发 人 员 们 往往 很 难 向 硬件 思维 导向 的 管理 者 解释 这 个 问题 ， 
因为 在 硬件 思维 管理 者 的 心中 产量 越 大 ， 单 位 成 本 应 该 越 低 。 

2. 通过 架构 设计 和 风险 处 置 的 方式 来 减少 返工 

在 原始 的 COCOMO 模 型 中 ， 最 接近 架构 设计 全 面 度 的 指标 是 现代 编程 实践 ， 包 括 了 自 上 而 
下 的 开发 方式 、 结 构 化 编程 以 及 设计 和 代码 检查 等 。 通常 的 看 法 是 ， 无论 对 于 大 型 项 目 还 是 小 型 
项 目 来 说 ， 这 些 实践 都 有 着 相同 的 影响 。 但 是 ,我 们 认为 规模 不 经 济 却 是 直接 取决 于 项 目的 开发 
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模式 。 例 如 下 列 模式 .。 
口 一 个 使 用 有 机 模式 (Organic-mode) 的 低 优先 级 的 项 目的 规模 一 工作 量 增长 指数 是 1.05。 
这 意味 着 如 果 产 品 的 规模 增加 一 倍 ， 工 作 量 将 增长 2.07 倍 〈 即 2 )。 
O 一 个 使 用 虑 入 模式 (Embedded-mode) 的 至 关 重 要 的 项 目的 增长 指数 是 1.20， 这 意味 着 产 
品 规模 增加 一 倍 的 话 ， 工 作 量 将 增长 2.30 倍 。 

我 们 把 COCOMO 数 据 库 中 的 63 个 项 目的 所 使 用 的 模式 的 规模 和 工作 量 的 增长 数据 对 应 起 来 
得 到 了 上 述 指数 。 

随后 , 我 们 于 20 世 纪 80 年 代 在 TRW 公 司 的 研究 和 经 验 显 示 , 改善 后 的 实践 可 以 减少 东 些 造成 
软件 开发 的 规模 不 经 谤 的 问题 《比如 返工 ) ， 而 全 面 的 架构 设计 则 是 改善 的 重要 措施 之 一 。 比 如 ， 
有 些 大 型 的 TRW 软 件 项 目 由 于 架构 设计 工作 以 及 风险 应 对 措施 没有 做 够 而 导致 了 很 高 的 返工 成 
本 ”“， 较 小 的 项 目 也 出 现 了 一 定 的 返工 成 本 。 

对 于 项 目的 缺陷 (主要 的 返工 成 本 来 源 之 一 ) 修复 成 本 数据 的 分 析 显 示 ，20% 的 缺陷 造成 了 
80% 的 返工 成 本 ， 而 这 20% 的 缺陷 主要 是 由 于 缺乏 足够 的 架构 定义 以 及 风险 应 对 措施 造成 的 。 

如 图 10-5 所 示 ， 在 TRW 项 目 A 中 ， 大 部 分 的 返工 都 是 由 网 络 操作 系统 使 用 了 不 完整 的 架构 造 
成 的 。 由 于 在 设计 架构 的 时 候 名 视 了 操作 系统 可 能 不 文 持 “在 网 络 处 理 如 功能 失 第 时 将 系统 故障 
转移 ”的 功能 ， 而 这 正 是 这 个 项 目 所 必须 的 。 当 在 系统 测试 中 发 现 了 这 个 问题 之 后 ， 它 就 会 变 成 
一 个 “架构 破坏 者 ", 导致 已 经 开发 好 的 软件 又 不 得 不 进行 一 系列 高 成 本 的 返工 。 在 项 目 B 中 有 一 
个 类 似 的 “架构 破坏 者 ”"， 那 就 是 在 项 目 晚期 才 发 现 的 处 理 超 长 消息 ( 即 超 过 100 万 个 字符 ) 的 重 
要 性 .B 项 目 不 完整 的 架构 假设 所 有 的 消息 都 会 很 得 并 且 在 封包 交换 网 络 架构 中 很 容易 处 理 。( 做 
出 这 个 假设 有 部 分 原因 古 需 求 声明 比较 模糊 ， 即 “系统 应 该 圆满 地 发 送 所 有 提交 给 它 的 信息 ”。) 














aa 
s" 
ost 
oot? 
oe? 
. 
ot 
sr 
. 
ba 
° 
+ 
+ 
* 
+? 
o 









TRWM AA 


i 00 373 SPRs 

长 50 

e 主要 返工 原因 ， 
不 正常 架构 破坏 者 
= 30 A- 网 络 故 障 


B- 超 长 信息 


0 10 20 30 40 50 60 70 80 90 100 
软件 问题 报告 百分比 (SPRs) 


图 10-5 ”对 应 高 危 元 素 的 较为 陡峭 的 修复 成 本 增长 曲线 
这 样 的 结 琳 使 得 TRW 和 制定 了 各 种 政策 ， 要 求 开 发 人 员 在 项 目的 初步 设计 评审 (Preliminary 
Design Review, PDR) 阶段 对 所 有 的 需求 做 完整 的 风险 分 析 。 由 于 TRW 采 用 了 Ada 编 程 语言 ， 而 
这 个 语言 又 可 以 确保 模式 规格 的 一 致 性 , 这 条 风险 分 析 的 政策 也 延伸 扩展 成 了 Ada 流 程 模型 (Ada 
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Process Model)， 并 要 求 在 PDR 之 前 ,软件 的 架构 就 必须 通过 Ada 编 译 器 模块 一 致 性 检查 ”。 这 就 
让 后 来 的 软件 项 目 可 以 在 程序 员 写 代码 和 做 单元 测试 之 前 就 做 好 大 部 分 的 系统 集成 工作 。 

3. 一 个 成 功 的 例子 : CCPDS-R 

由 于 吸取 了 在 上 一 廊 中 所 搬 述 的 经 验 教训 并 在 PDR 之 前 消除 了 架构 上 的 风险 , 在 后 来 的 项 目 
中 ， 由 架构 破坏 者 造成 的 后 期 的 返工 大 大 减少 了 ,而 修复 成 本 曲线 也 更 平稳 了 。 在 这 里 有 个 很 好 
的 例子 ， 那 就 是 Royce 报 告 ”中 所 描述 的 “指挥 中 心 处 理 及 显示 系统 - 标 换 版 ”(Command Center 
Processing and Display System-Replacement, CCPDS-R) 项 目 ， 图 10-6 展 示 了 其 平稳 的 修复 成 本 曲 
线 。 这 个 项 目 在 规定 时 间 内 用 规定 的 预算 交付 了 超过 100 万 行 Ada 代 码 。 

在 CCPDS-R 项 目 中 ， 人 们 修改 了 固定 流程 的 瀑布 开发 模式 ， 延 缓 了 里 程 碑 版 本 的 发 布 日 期 ， 
以 便于 早期 束 采 用 基于 风险 评估 的 螺旋 型 开发 模式 。 举 例 来 说 ,这 个 项 目 预计 用 35 个 月 来 完成 第 
一 版 的 交付 ， 而 其 PDR 是 在 项 目的 第 14 个 月 进行 的 的 ， 花 费 了 第 一 版 预算 的 14， 包 括 了 设计 和 
验证 其 高 风险 的 软件 组 件 ， 比 如 其 网 络 操作 系统 以 及 用 户 界面 的 关键 部 分 。 
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图 10-6 ”降低 修复 成 本 成 长 率 ; CCPDS-R 


10.3.2 Ada COCOMO 及 COCOMO ll 中 的 架构 设计 以 及 风险 应 对 系数 


图 10-6 中 所 展示 的 大 型 项 目 中 平稳 的 修复 成 本 曲线 证 实 了 对 于 架构 设计 和 风险 处 理 更 多 的 
重视 降低 了 大 型 项 目 中 的 返工 和 规模 不 经 济 的 情况 。 从 1987 年 到 1989 年 ，TRW 为 使 用 Ada 流 程 模 
型 的 大 型 关键 项 目 设 计 了 一 个 专门 版 本 的 COCOMO， 称 之 为 Ada COCOMOr 1。 它 降低 了 Ada 流 
程 模 式 所 具备 的 1.20 的 规模 -工作 量 增长 系数 。 而 由 于 改善 了 架构 设计 以 及 风险 应 对 ， 它 还 减少 
了 项 目的 规模 不 经 济 的 情况 ， 降 低 了 对 成 本 的 估算 ， 并 帮助 政府 和 业内 的 管理 者 从 相对 僵化 、 流 
水 线 式 、 基 于 文档 的 旧式 流程 ， 转 化 到 更 多 基于 风险 的 并 行 开 发 流程 。 

1. Ada 流 程 模式 如 何 推动 基于 风险 的 并 行 开发 软件 流程 

Ada 流 程 模 式 以 及 CCPDS-R 项 目 表 明 ， 我 们 完全 可 以 改造 顺序 式 的 瀑布 流程 模式 ,使 其 成 为 
一 个 更 现代 的 基于 风险 的 模式 ， 并 同时 进行 需求 、 架 构 以 及 规划 的 活动 。 这 个 模型 的 审查 标准 主 
要 关注 软件 组 件 的 兼容 性 以 及 可 行 性 。 

随后 , 研究 人 员 们 把 这 些 实践 整合 成 了 通用 的 软件 开发 以 及 系统 工程 的 流程 ,以 用 于 各 类 需 
要 密集 软件 开发 的 系统 。 这些 模 型 强调 的 是 基于 风险 的 并 行 开发 , 以 及 相应 的 里 程 碑 版 本 审核 判 
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断 条 件 站 。 这 些 模 型 包括 如 下 内 容 。 
O Rational 统 一 流程 (Rational Unified Process, RUP) P109] [20] 
D 口 USC 基 于 模式 的 系统 架构 设计 以 及 软件 工程 学 (Model-Based System Architecting and 
Software Engineering, MBASE) 模式 中。 这 个 模型 相应 的 又 加 入 了 : 
m 风险 驱动 的 并 行 工 程 学 共 赢 螺旋 模型 (The risk-driven concurrent engineering WinWin 
spiral model) l, 
m Rechtin 并 行 工 程 系统 架构 设计 方法 和 。 

RUP 和 MBASE 都 使 用 了 参照 点 式 里 程 碑 版 本 集 来 为 项 目 分 阶段 ， 这 些 里 程 碑 版 本 集 包 括 生 
命 周 期 目标 (Life Cycle Objectives, LCO) 和 生命 周期 架构 (Life Cycle Architecture, LCA), ix 
些 里 程 碑 版 本 是 由 USC 软 件 工程 中 心 及 其 分 支 的 30 个 政府 及 行业 机 构 所 参与 的 研讨 会 选 定 ， 并 
用 来 作为 COCOMO II 成 本 及 日 程 安排 估算 的 阶段 分 隔 标准 。LCO 和 LCA 的 里 程 碑 式 参照 点 的 通 
过 /不 通过 的 条 件 是 如 下 所 示 。 

OD 开发 人 员 提 供 证 据 ， 并 由 独立 的 专家 组 验证 ， 证 明 系 统 是 按照 既定 的 架构 来 实现 的 ， 其 

必须 : 

e ; 贰 足 所 有 的 需求 一 一 功能 、 春 面 、 服 务 等 级 以 及 升级 发 展 ; 
m 对 可 操作 理念 的 支持 ，; 

m 可 以 在 计划 的 预算 和 日 程 内 完成 

m 能 产生 足够 的 投资 回报 率 (Return On Investment, ROI); 
四 让 所 有 与 项 目 成 功 密切 相关 的 各 方 都 能 满意 。 

口 所 有 重大 风险 都 有 对 应 的 风险 管理 方案 来 解决 。 

最 近 ，MBASE 方 法 已 经 扩展 成 了 增 量 承诺 模式 (Incremental Commitment Model，ICM) ， 可 
以 全 面 地 用 于 系统 及 软件 的 开发 。 这 种 模式 除了 使 用 里 程 碑 式 的 参照 点 之 外 ， 还 使 用 了 可 行 性 理 
论 ， 用 于 在 系统 的 染 构 设计 、 需 求 、 运 行 原理 、 计 划 以 及 商业 考量 中 同步 和 稳定 硬件 、 软 件 和 人 
三 个 因素 1。 有效 的 可 行 性 理论 应 该 包含 经 过 架构 设计 的 权衡 以 及 可 行 性 分 析 (如 Clements l 
和 Maranzano 全 讨论 的 那 种 ) 得 出 的 关于 可 行 性 的 证 据 。 

可 行 性 证 据 的 不 足 表 现 为 项 目 遭 受 损 失 的 不 确定 性 或 者 可 能 性 , 我 们 可 以 把 这 些 概率 乘 以 项 
目 损失 的 规模 ， 就 可 以 得 出 风险 曝光 度 (Risk Exposure)。 主 要 的 项 目 关系 方 可 以 使 用 风险 曝光 
度 来 确定 是 否 继续 进入 下 一 阶段 ( 即 风险 可 接受 )、 跳 过 下 一 阶段 ( 即 风 险 微 不 足 道 )、 延 长 当前 
的 阶段 (风险 较 高 但 仍 可 探 ) 或 者 终止 /重新 设计 项 目 〈 风 险 不 可 接受 ) 。 要 想 确 保 我 们 能 获取 足 
够 的 风险 信息 ,搜集 可 行 性 证 据 就 必须 作为 高 优先 级 的 项 目 日 标 之 一 , 而 不 是 作为 一 个 随时 可 能 
因为 预算 和 时 间 的 原因 被 丢弃 的 可 做 可 不 做 的 附属 任务 。 

2. COCOMO ll 中 的 架构 设计 和 风险 对 应 (RESL) 系数 

为 了 说 服 项 目 经 理 们 加 大 对 可 行 性 证 据 搜 集 的 投入 , 我 们 就 必须 提供 实证 证 据 来 证 明和 花 在 可 
行 性 证 据 上 的 时 间 将 会 带 来 可 靠 的 投资 回报 (ROI)。 我 们 用 了 161 个 具有 代表 意义 的 项 目 来 为 
COCOMO II 成 本 佑 算 模 型 做 校准 的 时 候 ， 确 定 了 值得 搜集 可 行 性 证 据 的 项 目 必 须 有 具备 的 条 件 。 

在 1995 ~ 1997 H], 在 USC 及 其 30 个 政府 和 行业 内 的 分 支 机 构 组 成 的 研讨 会 中 , COCOMO II 
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软件 成 本 估算 模型 的 定义 “得 到 了 发 展 。 其 规模 不 经 济 系数 依赖 于 架构 设计 及 风险 对 应 (RESL) 
系数 以 及 其 他 四 个 规模 系数 : 能 力 成 熟 度 模型 (Capability Maturity Model) 中 的 成 熟 度 水 平 ， 开 发 
人 员 - 客 户 - 用 户 团 队 凝 聚 力 (Developer-customer-user team cohension) ， 优 先 性 (Prededentedness ) ， 

以 及 开发 灵 话 度 (Development Flexibility), 

对 于 RESL 级 别 表 的 定义 见 表 10-1 中 的 七 个 组 成 系数 。 正 如 在 “Ada 流 程 模 式 如 何 推动 基于 
风险 的 并 行 开 发 软件 流程 ” 那 一 节 中 所 展示 的 那样 ,架构 设计 和 风险 应 对 包括 了 并 行 系统 的 运行 
概念 、 要 求 、 计 划 、 商 业 芳 量 、 可 行 性 理由 以 及 架构 ， 也 就 是 说 包括 了 软件 系统 工程 中 的 大 部 分 
RIR. 





表 10-1 RESL 级 别 表 








特 fiE 非 常 低 低 中 高 非常 高 A 高 
风险 管理 计划 指出 了 全 部 的 重大 风 ”无 很 少 = 普遍 大 部 分 ”完全 
仿 并 用 PDR 或 者 LCA 的 方式 确立 了 解 
决 这 些 风 险 的 里 程 碑 式 参照 点 
通过 PDR 或 LCA 的 方式 设置 的 日 程 无 很 少 = 普遍 大 部 分 HE 
安排 、 预算 以 及 内 部 里 程 碑 参 照 点 符合 
风险 管理 的 计划 
在 已 经 有 了 大 体 目 标的 情况 下 ,项 目 5 10 17 25 23 40 
组 分 配 了 百 分 之 多 少 的 开发 时 间 在 架 
构 设 计 上 
M A ALMA ABA TAB 20 40 60 80 100 120 
的 百分比 
用 于 解决 风险 、 设计 和 验证 架构 的 工 ”无 很 低 = 好 很 好 完整 
FLAY Sc FFE 
关键 架构 设计 元 素 (任务 、UI. 现成 ” 极 高 很 高 中 等 少量 很 少 非常 少 
解决 方案 、 硬 件 、 技 术 和 效率 等 ) 的 不 
确定 性 
风险 的 数量 以 及 重要 程度 >10 重 要 5 一 10 重 要 2~4 重 要 ”1 重要 >5 不 重要 <5 不 重要 


每 个 为 COCOMO I 的 数据 库 提供 数据 的 项 目 在 计算 其 RESL 级 别 的 时 候 都 使 用 表 10-1 来 作为 
参考 。COCOMO II 的 研究 人 员 和 项 目 人 人 员 在 收集 数据 的 过 程 中 一 同 确定 了 表格 中 每 一 行 数据 的 
相对 权重 。COCOMO I 数 据 库 中 的 161 个 项 目的 RESL 级 别 大 致 是 按照 正 态 分 布 ， 如 图 10-7 所 示 。 

我 们 将 COCOMO II 的 数据 库 中 的 161 个 软件 项 目 中 的 专家 意见 和 对 规模 、 工 作 量 以 及 成 本 评 
级 的 多 元 回归 分 析 用 贝 叶 斯 定理 (Bayesian) 的 方式 综合 起 来 ,用 于 确定 项 目的 RESL 对 于 其 规模 
不 经 济 系数 的 有 影响。 这些 项 目 涵盖 了 商业 的 开 应 用 程序 、 电 子 服 务 、 电 讯 、 中 间 件 、 工 程 及 科学 、 
指挥 控制 、 实 时 流程 控制 等 多 种 领域 。 项 目的 规模 从 2.6 到 1300 千 行 不 等 ， 每 千 行 等 同 于 源 代码 
fy (KSLOC)， 其 中 13 个 项 目 低 于 10 KSLOC，5 个 项 目 超过 1000 KSLOC。 用 等 同 的 源 代码 行 数 
作为 标准 可 以 衡量 软件 的 重用 度 ， 以 及 需求 的 变动 度 。 

我 们 将 专家 们 对 于 COCOMO I 中 带动 成 本 的 参数 的 平均 值 及 标准 差 的 意见 作为 贝 叶 斯 定理 
的 先 验 值 ， 相 对 的 ， 把 通过 对 历史 数据 多 元 回归 分 析 后 得 出 的 平均 值 及 标准 差 作为 贝 叶 斯 定理 的 
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后 验 值 。 使 用 由 叶 斯 定理 的 方法 绿 合 各 方 的 数值 之 后 , 我 们 将 得 到 专家 意见 及 历史 数据 的 加 权 平 
均值 ， 对 于 那些 标准 差 较 小 的 参数 值 , 权重 就 会 更 高 。 详细 的 方法 及 公式 请 参见 关于 COCOMO I 
的 专著 第 4 章 “。 


架构 /REST 





图 10-7 COCOMO II 数据 库 中 的 161 个 项 目的 RESL 评 分 


3. 采用 了 架构 设计 和 风险 应 对 之 后 的 改善 

我 们 对 于 RESL 级 别 的 计算 验证 了 我 们 的 假设 ， 即 在 软件 开发 中 ， 如 果 架 构 设计 以 及 风险 应 
对 没有 做 足 \ 即 系统 工程 没有 做 足 ) ， 就 会 导致 项 目 工作 量 增 加 ， 因 为 在 开发 后 期 项 目 组 将 不 得 
不 投入 大 量 的 精力 来 返工 重 做 ， 以 克服 架构 设计 上 的 缺陷 并 解决 研发 后 期 出 现 的 风险 。 我 们 还 假 
设 ， 依照 我 们 对 软件 项 目 规模 不 经 济 的 认识 ， 对 于 越 大 的 项 目 ， 返 工 的 比率 会 越 大 。 

对 这 些 项 目的 RESL 级 别 以 及 另外 22 个 COCOMO I 模型 中 影 啊 成 本 的 参数 进行 的 回归 分 析 
产生 了 统计 上 显著 的 结果 , 证 明了 我 们 的 假说 。 我 们 对 这 161 个 项 目 进 行 研 究 的 结果 表明 ,“ 非 常 
低 ” 与 “ 极 高 ”RESL 级 别 的 项 目 之 间 的 成 本 -规模 增长 指数 差距 有 0.0707。 这 对 于 10 KSLOC 的 
项 目 来 说 相当 于 多 了 18% 的 额外 工作 量 ， 而 对 于 超大 型 的 10000 KSLOC 的 项 目 来 说 ， 就 是 92% 的 
额外 工作 量 。 

图 10-8 总 结 了 这 些 分 析 的 结果 。 研 究 表 明 ， 至 少 在 这 161 个 软件 项 目 中 ， 规 模 越 大 ， 增 长 的 
成 本 和 工作 量 就 相对 地 越 大 ， 这 与 COCOMO II 模 型 中 另外 22 个 影 啊 成 本 的 参数 无 关 。 我 们 通过 
对 另外 22 个 参数 进行 的 回归 分 析 证 明了 这 一 点 。RESL 参 数 的 统计 显 埋 性 是 2.084， 超 过 了 23 个 变 
量 以 及 161 个 数据 点 的 统计 显著 性 值 1.96， 如 表 10-2 所 示 。 此 外 ， 配 对 相关 度 分 析 显 示 ，RESL 及 
其 他 所 有 变量 的 相关 系数 没有 超过 0.4。 
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图 10-8 ”减免 软件 系统 设计 所 市 来 的 附加 成 本 
表 10-2 COCOMO II 回归 分 析 结 果 
数据 集 =COCOMO 11.2000 


反应 =log[PM] 
系数 估计 

i 记 估 计 标 准 差 t- 值 
Constant A 0.961552 0.103346 9.304 
log[SIZE] 0.921827 0.0460578 20.015 
PMAT*log[SIZE] 0.684836 0.481078 1.424 
PREC* log[SIZE] 1.10203 0.373961 2.947 
TEAM*log[SIZE] 0.323318 0.497475 0.650 
FLEX* log[SIZE] 0.354658 0.686944 0.516 
RESL* log[SIZE] 1.32890 0.637678 2.084 
log[PCAP] 1.20332 0.307956 3.907 
log[RELY] 0.641228 0.246435 2.602 
log[CPLX] 1.03515 0.232735 4.448 
log[TIME] 1.58101 0.385646 4.100 
log[STOR] 0.784218 0.352459 2.225 
log ACAP] 0.926205 0.272413 3.400 
log[PLEX] 0.755345 0.356509 2.119 
log[LTEX] 0.171569 0.416269 0.412 
log[DATA] 0.783232 0.218376 3.587 
log[RUSE] —0.339964 0.286225 -1.188 
log[DOCU] 2.05772 0.622163 3.31 
log[PVOL] 0.867162 0.227311 3.815 
log[ APEX] 0.137859 0.330482 0.417 
log[PCON] 0.488392 0.322021 1.517 
log[ TOOL] 0.551063 0.221514 2.488 
log[SITE] 0.674702 0.498431 1.354 
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10.3.3 ”用 于 改善 系统 设计 的 投入 的 ROI 


在 前 一 节 中 ， 我 们 证 明了 软件 架构 设计 的 重点 应 该 是 同时 对 系统 需求 、 架 构 、 规 划 、 预 算 以 
及 日 程 安排 等 使 用 风险 驱动 的 方法 进行 计划 。 此 外 ,还 需要 在 原型 设计 、 建 模 以 及 分 析 上 加 大 投 
入 ,以 保证 项 目的 前 后 一 致 性 和 可 行 性 。 风 险 承 担 者 在 项 目的 每 个 阶段 都 进行 审查 ,并 建立 对 下 
一 个 阶段 的 开发 的 信心 ， 对 于 项 目的 成 功 至 天 重要 ， 我 们 在 本 草 前 面部 分 已 经 讨论 过 了 。 

10-8 中 展示 的 用 COCOMO I 的 方式 来 计算 RESL 级 别 的 结 末 让 我 们 可 以 确定 这 种 投入 的 
ROI， 即 将 以 构 设 计 以 及 风险 应 对 所 需要 的 额外 的 工作 量 和 不 同 规模 的 软件 项 目 能 够 元 此 而 菠 约 
的 成 本 进行 对 比 。 表 10-3 总 结 了 从 1 万 到 1000 万 行规 模 的 软件 系统 的 结 末 。 表 格 之 后 古 我 们 计算 
这 些 值 的 具体 方法 。 





表 10-3 ”软件 系统 设计 /RESL 的 ROI 


COCOMO II RESL 等 级 非 常 低 低 中 高 非常 高 极 高 
RESL 时 间 投 入 % 5 10 17 25 33 >40 (50) 
工作 量 水 平 0.3 0.4 0.5 0.6 0.7 0.75 
RESL 成 本 投入 % 1.5 4 8.5 15 23 37.5 
投入 增 量 2.5 4.5 6.5 8 14.5 
返工 工作 量 的 规模 增长 指数 1.0707 1.0565 1.0424 1.0283 1.0141 1.0 
10 KSLOC 的 项 目 
附加 的 工作 量 % 17.7 13.9 10.3 6.7 3.3 0 
效益 ， 成 本 增 量 3.8，2.5 3.6，4.5 3.6, 6.5 3.4, 8 3.3, 14.5 
ROI 增 量 0.52 -0.20 ~0.45 —0.58 -0.77 
100 KSLOC 的 项 目 
附加 的 工作 量 % 38.4 29.7 21.6 13.9 6.7 0 
效益 ， 成 本 增 量 8.7, 2.5 8.1, 4.5 7.7, 6.5 7.2, 8 6.7, 14.5 
ROI 增 量 2.48 0.80 0.18 -0.10 -0.54 
1000 KSLOC 的 项 目 
附加 的 工作 量 % 63 47.7 34.0 21.6 10.2 0 
725, WASTE 153; 25 13.7, 4.5 12.4, 6.5 11.4, 8 10.2, 14.5 
ROI 增 量 5.12 2.04 0.91 0.42 -0.30 
10000 KSLOC 的 项 目 
附加 的 工作 量 % 91.8 68.3 47.8 29.8 13.9 0 
效益 ， 成 本 增 量 23.5, 2.5 20.5, 4.5 18.0, 6.5 15.9, 8 13.9, 14.5 





表 10-3 的 前 儿 行 展示 的 是 所 有 项 目的 综合 统计 ， 表 格 内 容 解 释 如 下 。 


e RESLOĪ 0 OD% 


这 是 最 重要 的 指标 , 所 有 的 值 都 相对 这 个 指标 来 进 
评价 等 级 来 说 花费 在 染 构 设计 上 的 时 间 的 百分比 。 








行 衡量 ,这 个 值 代表 了 对 于 每 个 RESL 
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e {0000 

在 该 RESL 等 级 下 的 项 目 成 员 平 均 工 作 量 占 总 工作 量 的 比重 。 这 个 值 的 结果 看 上 去 和 软 
件 项 目 早期 可 以 观察 到 的 瑞 利 分 布 曲 线 类 似 ”。 
e RESLO O O O% 

预算 中 划分 给 架构 设计 以 及 风险 应 对 的 部 分 所 占 的 百分比 。 计 算 方 法 是 用 RESL 的 时 间 
投入 百分比 乘 以 每 个 RESL 等 级 的 项 目 平均 人 力 投 入 。 举 例 来 说 ， 对 于 “非常 低 ” 的 RESL 投 
入 级 别 来 说 ， 就 是 5 x 0.3=1.5。 
e 0000 

即 当前 等 级 的 RESL 投 入 成 本 百分数 减 去 前 一 等 级 的 投入 成 本 百分数 。 例 如 ， 对 于 “ 低 ” 
等 级 的 RESL 投 入 来 说 ， 投 入 增 量 就 是 4-1.5=2.5%6。 
e 00000000000 

从 161 个 项 目的 评级 情况 来 看 ，RESL 人 参数 对 于 软件 项 目的 工作 量 有 着 指数 级 的 影响 。 

表格 其 余部 分 显示 了 四 个 不 同 的 系统 规模 〈10KSLOC 到 10000KSLOC) 的 数值 ， 以 及 5 
种 不 同 的 RESL 级 别 下 的 ROI。 计 算 的 顺序 如 下 : 
e O00000 

将 返工 的 规模 增长 指数 (401.0707) 乘 以 系统 规模 (4010 KSLOC)， 并 计算 增加 了 多 
少 工 作 量 。 比 如 说 ， 对 于 10 KSLOC 的 项 目 来 说 ,， “非常 低 ” 的 RESL 水 平 的 附加 工作 量 计算 
如 下 : 








pore 
C 


eHUUU 
前 一 评级 下 的 附加 工作 量 减 去 当前 评级 下 的 附加 工作 量 。 比 如 ， 对 于 “ 低 ” 的 RESL 水 


平 来 说 ， 效 共 增 量 就 是 17.7-13.9=3.8。 0 
e [DUUD 


与 前 面 说 明 过 的 投入 增 量 相同 。 
© ROID GT 
利益 减 去 成 本 再 除 以 成 本 : 
1.0707 
a G0 
=17.7 
比如 对 于 1 万 行 代码 的 项 目 来 说 ,，“ 低 ”RESL 级 别 的 ROI 增 量 计算 如 下 : 
(3.8-2.5) 
© 25 
= 0.52 
这 些 计算 结果 显示 , 随 着 RESL 的 投入 逐渐 增 大 ,其 所 带 来 的 ROI 增 量 也 越 来 越 小 。 较 大 的 项 
目的 ROI 增 加 比较 多 ， 增 加 的 持续 时 间 也 比较 长 ， 因 为 这 些 项 目 常 常 一 开始 返工 水 平 就 很 高 ， 使 
得 其 进步 的 空间 也 更 大 。 图 10-9 展 示 了 这 些 结果 。 
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图 10-9 ”系统 染 构 设计 市 来 的 ROI 增 量 
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10.4 ”那么 到 底 架 构 要 做 到 什么 程度 才 够 


现在 ,我 们 可 以 使 用 前 面 的 计算 结 末 ， 来 大 致 回 谷 这 个 项 目 规划 阶段 的 核心 问题 。 

我 们 进行 这 个 研究 的 动机 源 自 一 个 非常 大 的 软件 项 目 (超过 10000 KSLOC), 项 目 组 希望 承 
包 开 发 的 公司 能 够 尽快 地 开始 工作 , 所 以 他 们 冒 着 架构 设计 以 及 风险 应 对 不 足 的 风险 , 没有 把 计 
划 和 规格 文档 放 到 征求 建议 书 (RFP) 中 。 这 个 项 目 组 必须 找到 它 的 “平衡 点 ”: 一 方面 必须 避 
人 饮 承 包 商 做 出 不 合格 的 组 件 ， 因 为 那样 就 意味 着 返工 ， 也 就 会 造成 日 程 超标 ， 男 一 方面 ， 他 们 又 
必须 考虑 到 系统 架构 设计 以 及 风险 应 对 的 时 间 成 本 问题 , 因为 如 果 前 期 时 间 花 费 过 多 可 能 造成 承 
包 商 没有 足够 的 时 间 来 进行 开发 。 本 市 将 展示 的 就 是 如 何 用 COCOMO I 的 RESL 等 级 来 找 出 适合 
这 个 项 目 以 及 其 他 规模 项 目的 染 构 设计 平衡 点 。 

表 10-4 展 示 了 在 10 KSLOC、100 KSLOC 以 及 10000 KSLOC 的 项 目 中 ， 每 个 RESL 等 级 所 对 
应 的 架构 设计 投入 百分比 。 表 中 还 展示 了 相应 的 总 交付 延迟 百分比 ， 这 些 百分比 的 计算 方法 是 
用 架构 设计 的 时 间 投 入 加 上 返工 消耗 的 时 间 。 此 处 为 了 把 附加 的 工作 量 表示 为 附加 的 时 间 安 排 ， 
我 们 假设 返工 期 间 团 队 的 规模 不 变 。 表 10-4 的 最 后 两 行 显示 ， 当 架构 投入 在 33% 或 者 更 少时 , 这 
些 附加 投入 比 市 省 的 返工 时 间 要 多 (10000 KSLOC 的 项 目 )， 而 超过 33% 以 后 ， 总 延迟 百分比 增 
加 了 。 简 而 言 之 ， 就 是 对 于 10000 KSLOC 的 项 目 来 说 ， 延 迟 最 小 的 架构 设计 投入 百分比 的 平衡 
点 是 33%。 

图 10-10 上 半 部 分 用 图 形 的 方式 展示 了 表 10-4 中 的 数据 。 图 表 显 示 ， 对 于 10000 KSLOC 的 项 
目 来 说 , 平衡 点 是 在 架构 投入 37% 前 后 的 局 平 区 域 (这样 的 分 析 结 果 使 得 这 个 项 目的 项 目 组 额外 
增加 了 18 个 月 来 做 架构 设计 )。 对 于 100 KSLOC 的 项 目 来 说 , 平衡 点 大 概 在 20% 前 后 的 届 平 区 域 。 
对 于 10 KSLOC 的 项 目 来 说 ,平衡 点 大 概 在 5% 前 后 。 图 10-10 和 表 10-4 者 表明， 对 于 小 项 目 来 说 ， 
架构 设计 投入 的 用 处 不 大 ， 但 是 项 目 越 大 ， 甚 重要 性 和 必要 性 都 越 来 越 明 显 。 
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表 10-4 ”架构 设计 投入 对 项 目 延 迟 的 影响 
COCOMO IIRESL 等 级 JE 常 低 低 中 高 非常 高 极 高 


RESL 时 间 投 入 % 5 10 17 25 33 >40 (50) 
返工 工作 量 的 规模 增长 指数 1.0707 1.0565 1.0424 1.0283 1.0141 1.0 
10 KSLOC 的 项 目 

附加 的 工作 量 % 17.7 13.9 10.3 6.7 3.3 0 
Tht A HEIR % 23 24 27 32 36 50 
100 KSLOC 的 项 目 

附加 的 工作 量 % 38.4 29.7 21.6 13.9 6.7 0 
项 目 延 迟 % 43 40 38 39 40 50 
10000 KSLOC 的 项 目 

附加 的 工作 量 % 91.8 68.3 47.8 29.8 13.9 0 
Hi H 1ER% 96 78 65 55 47 50 





10-10 的 下 半 部 分 展示 的 征 最 近 我 们 对 COCOMO I 数据库 中 项 目的 需求 变动 性 及 系统 危险 
性 的 进一步 分 析 。 图 中 的 实 线 表 示 100KSLOC 的 项 目的 任务 平均 返工 以 及 架构 设计 的 成 本 , 左边 
写 着 “总 成 本 ”的 几 条 线 代 表 了 总 成 本 。 虚 线 表示 的 是 由 于 需求 变动 程度 比 正 第 的 大 而 造成 染 构 
设计 成 本 增加 50% 的 时 候 ， 架构 设计 及 总 成 本 关系 的 变化 。 定 量 地 说 ， 在 这 种 情况 下 的 高 回报 率 
的 架构 投入 平衡 点 就 从 20% 转 移 到 了 10% (实际 上 应 该 是 15%， 因 为 巨大 的 变动 程度 带 来 了 50% 
的 额外 成 本 )。 这 样 看 来 ， 对 于 需求 变动 非 第 大 的 项 目 来 说 ， 由 于 进行 各 种 分 析 的 成 本 较 高 ， 而 
在 需求 迅速 变化 的 情况 下 文档 又 必须 不 停 整 改 , 所 以 在 架构 设计 、 可 行 性 分 析 以 及 其 他 文档 上 的 
高 投入 会 导致 人 不 敷 出 。 

10-10 的 下 半 部 分 中 的 短 划 线 表 示 的 是 对 未 识别 的 架构 不 足 而 引起 的 系统 错误 的 外 部 成 本 
所 进行 的 保守 分 析 。 这 些 由 架构 设计 不 足 所 导致 的 损失 不 止 包括 额外 的 返工 时 间 , 还 包括 了 组 织 
在 效率 和 生产 力 上 造成 的 损失 。 保 守 佑 计 ， 此 类 成 本 将 导致 项 目 返 工 成 本 提高 30%。 在 大 多 情况 
下 ， 对 于 质量 要 求 较 高 的 系统 ， 奶 加 的 成 本 会 相应 地 更 高 。 

定量 地 说 ， 对 于 100KSLOC 的 项 目 ， 高 回报 率 的 架构 设计 投入 平衡 点 就 从 约 20% 转 到 了 超过 
30%。 正 如 前 面 所 说 的 ， 所 有 的 这 些 平 衡 点 其 实 都 是 相对 局 平 的 “平衡 区 域 ， 即 平衡 点 前 后 的 
5% ~ LOMITA. 不 过 , 如 琳 选 择 的 投入 度 比 较 徘 丫 平衡 区 域 的 边 绿 部 分 而 项 目的 预期 又 过 于 乐 
观 的 话 ， 遭 遇 重 大 损失 的 风险 融会 增加 。 

如 末 总 结 一 下 我 们 从 图 10-10 中 学 到 的 经 验 ， 那 就 是 项 目的 规模 、 风 附和 稳定 性 越 大 ， 那 么 
对 染 构 设计 和 可 行 性 评估 的 需求 就 越 大 。 不 过 ， 对 于 规模 非 第 小 、 风 险 很 低 而 且 需 求 变化 还 很 快 
的 项 目 来 说 ,架构 设计 做 多 做 少 并 没有 什么 区 别 。 并 且 ， 对 于 这 种 项 目 来 说 ， 如 末 不 停 反 复 地 做 
架构 设计 ， 就 有 可 能 让 ROI 变 成 负数 。 在 这 类 项 目 中 , 敏捷 的 方法 (如 XP) 会 更 有 效 。 总 的 来 说 ， 
有 了 以 证 据 为 基础 的 详 述 和 计划 并 不 能 保证 项 目 一 定 会 成 功 , 但 古 通 常 来 说 可 以 解决 现在 很 多 项 
目 中 都 存在 的 预算 超时 及 不 足 的 问题 。 
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规模 对 平衡 点 的 影响 
10 000 千 行 等 价 = 
— 源 代码 (KSLOC) @ 平衡 点 
904 ， 项 目 初始 风险 与 架构 时 间 预 算 
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架构 与 风险 处 理 的 时 间 百 分 比 
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图 10-10 项 目的 架构 设计 不 足 所 引发 的 额外 成 本 及 其 相应 的 架构 设计 投入 平衡 点 


我 们 还 有 一 个 最 后 的 忠告 ， 那 就 是 图 10-10 中 所 展示 的 平复 UMTS Aa 所 有 的 项 目 ， 它 
们 只 能 作为 前 期 指标 来 找 出 适合 的 以 构 设计 投入 的 邯 围 。 当 项 目 进行 到 了 详细 的 规划 及 预算 制定 
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阶段 时 , 其 他 的 一 些 影响 成 本 的 因素 , 如 个 人 能 力 和 经 验 、 程 序 的 复杂 度 、 旧 系统 的 迁移 复杂 度 、 
技术 风险 、 流 程 的 成 熟 度 以 及 支持 工具 等 ， 也 可 能 会 对 染 构 设计 投入 多 平衡 后 造成 影 啊 。 最 近 ， 
研究 人 员 们 设计 并 标准 化 了 一 个 新 的 模型 ， 称 之 为 建设 性 系统 工程 模型 (Constructive Systems 
Engineering Model, COSYSMO), ， 这 个 模型 可 以 更 精准 地 确定 项 目 所 需要 的 架构 设计 投入 。 


10.5 ”架构 设计 是 否 必须 提前 做 好 


很 多 敏捷 项 目 邦 通 过 进行 大 量 的 架构 设计 工作 获得 了 成 功 , 但 古 这 些 项 目 邦 把 染 构 设计 工作 
通过 重 构 的 方式 分 散 到 了 整个 项 目 周 期 。 只 要 项 目 规模 小 、 风 险 不 高 ， 这 样 做 是 很 高 效 的 , 但 是 
如 本 项 目的 规模 和 风险 变 大 ， 那 么 就 有 可 能 造成 “避重就轻 ” 却 的 问题 设计 。 

比如 在 “中 描述 的 那个 租约 管理 器 项 目 ， 当 这 个 项 目 以 一 个 较 小 的 规模 逐渐 成 长 壮大 的 时 
候 , 旧 有 的 依靠 开发 人 员 之 间 的 默契 来 开发 以 及 就 地 解决 的 重 构 工作 做 法 却 无 法 跟 上 其 成 长 的 脚 
步 。 还 有 一 类 问题 ,就 是 当选 择 大 于 商用 的 现成 产品 进行 开发 时 ,我 们 会 迅速 地 开发 并 尽快 满足 
客户 的 需求 , 但 是 后 期 却 发 现 这 些 现 成 的 产品 无 法 适应 规模 的 增长 ,无 法 处 理 增加 的 工作 量 ， 而 
这 些 产 品 又 疫 有 源 代 码 可 供 重 构 。 有 个 与 此 相关 的 问题 ， 就 是 有 时 候 项 目 组 会 推 后 一 个 贯 罕 整 个 
程序 的 功能 ， 比 如 安全 检查 , 但 古 在 一 年 半 载 之 后 ， 却 发 现 此 时 想 要 再 添加 这 个 功能 或 者 把 这 个 
功能 重 构 进 早 前 的 架构 设计 已 经 不 可 能 了 。 所 以 , 我 们 一 定 要 预先 旁 卡 到 需求 的 发 展 ， 并 将 这 些 
考量 提前 加 入 到 架构 的 设计 中 。 
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根据 我 们 40 年 同 对 软件 的 问题 修正 的 成 本 和 延迟 的 研究 数据 ,大 型 项 目 中 , 在 产品 发 布 后 修 
正 问 题 和 在 需求 定义 阶段 修正 辣 题 的 成 本 比率 一 直 都 保持 在 100 : 1 左右 。 但 是 , 通过 在 项 目 早期 
投入 更 多 时 间 和 人 力 对 需求 进行 确认 和 验证 ， 这 个 比率 可 以 得 到 显 闭 地 降低 。 正 如 图 10-6 中 
CCPDS-R 项 目的 数据 所 显示 的 那样 ， 如 来 高 风险 的 修复 早 些 解决 ， 这 个 比例 可 以 接近 1 : 1。 

小 型 项 目的 比率 则 保持 在 5 : 1 左右 。 虽然 比率 不 高 , 但 古 我 们 仍然 可 以 将 其 再 降低 , 方法 就 
是 启用 优秀 的 人 才 以 及 敏捷 开发 方法 ,比如 结对 编程 和 持续 集成 , 这 样 就 能 缩短 修正 延迟 的 时 间 。 
小 型 、 低 风险 度 的 项 目 还 可 以 把 架构 设计 通过 重 构 的 方式 分 散 到 整个 开发 流程 中 , 但 是 需要 小 心 
不 要 用 “避重就轻 ”的 方式 来 做 早期 的 染 构 设计 ， 以免 后 期 无 法 通过 重 构 的 方式 来 加 入 需要 的 功 
能 ， 比 如 使 用 扩展 度 差 的 现成 产品 或 者 安全 性 低 的 数据 和 控制 结构 等 。 

最 近 的 一 些 关 于 架构 设计 以 及 风险 应 对 的 证 据 (如 CCPDS-R 相 关 的 证 据 ) 表明 , 要 找 出 所 谓 
“ 染 构 设计 古人 否 足 够 ”的 最 高 回报 率 的 平衡 点 到 的 是 多 少 ， 不 仅 需 要 旁氏 项 目的 规模 及 重要 性 的 
问题 〈 项 目 越 大 、 越 重要 需要 的 架构 设计 投入 就 越 多 ) ， 还 需要 芳 虑 需求 的 变动 性 〈 需 求 变化 快 
的 项 目 可 能 会 寻 致 大 量 的 文档 修订 、 修 改 工 作 而 使 得 项 目 进度 变 慢 )。 想 要 进行 更 加 详细 的 项 目 
规划 和 预算 制定 ,我 们 还 必须 按照 其 他 对 成 本 造成 影响 的 项 目 、 人 员 和 产品 因素 对 平衡 点 进行 调 
整 。 最 近 人 研究 出 的 一 个 COSYSMO 模 型 可 以 帮助 我 们 做 这 样 的 调整 。 

非常 大 型 的 项 目 比 较 可 能 会 有 高 重要 性 且 高 稳定 性 的 元 素 (比如 安全 性 相关 的 元 素 ), 还 可 能 
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会 有 需求 变化 度 高 的 元 素 (如 用 户 界 面 、 外 部 系统 界面 、 设 备 驱 动 程序 、 数 据 库 表 结构 等 )。 在 这 
样 的 情况 下 ， 我 们 可 以 使 用 混合 式 方 法 用 敏捷 方法 来 开发 变化 快 的 部 分 ， 而 使 用 基于 计划 的 方 
法 来 开发 较为 稳定 和 重要 的 部 分 。 这 种 方法 有 一 个 前 提 ， 那 就 是 系统 整体 是 基于 Parnas 报 告 ”中 
所 摘 述 的 用 模块 来 封装 变动 源 的 信息 隐藏 架构 。 

所 以 ， 对 于 未 来 那些 需求 变化 更 快 的 项 目 来 说 ， 疫 有 放 之 四 海 而 并 准 的 解决 方案 。 对 于 既 包 
含 了 重要 元 系 又 多 变 元 和 素 的 大 型 或 者 企业 级 的 项 目 来 说 , 最 好 采用 风险 驱动 的 流程 生成 法 ， 比 如 
增 量 保障 模型 (ICM) 或 者 风险 驱动 版 的 合理 统一 流程 。 这 些 模型 生成 法 使 用 开发 人 员 提 交 的 项 
目 可 行 性 数据 来 确定 项 目的 风险 。 对 于 那些 不 得 不 面 对 不 断 增 长 的 规模 、 重 要 性 、 变 动 性 和 复杂 
性 的 未 来 项 目 来 说 ， 想 要 成 功 就 必须 依赖 这 些 数 据 。 此 外 ， 使 用 这 种 基于 证 据 的 模型 还 有 个 双重 
好 处 : 一 方面 可 以 降低 风险 ， 另 一 方面 可 以 充实 证 据 知 识 库 ， 以 便于 将 来 进行 分 析 研 究 ， 找 出 更 
多 改善 项 目 和 企业 的 方法 。 
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第 11 章 
WE 威 推 论 
Christian Bird 


设计 和 编程 都 是 由 人 来 进行 的 ; 忘掉 这 一 点 的 话 ， 其 他 任何 事 都 没有 意义 。 


Bjarne Stroustrop 





11.1 RAEE 


1967 年 ， 一 位 名 叫 梅 尔 文 * EW (Melvin Conway) 的 早期 计算 机 科学 家 、 程 序 员 及 黑客 办 
《哈佛 商业 评论 》 提 交 了 一 篇 名 为 “组 织 是 如 何 进 行 发明 创 造 的 ? ”的 文章 , {Ee ar Zl ob T , 
理由 是 他 “ 没 能 证 明 访 理论”。 

对 于 软件 设计 界 来 说 , 邓 运 的 是 这 篇 文章 随后 被 Datamation 杂 志 (当时 一 流 的 开 杂 志 ) 接受 ， 
并 于 1968 年 发 表 “"。 后 来 ，Fred Brooks 在 其 开创 性 作品 《人 月 神话 》“ 中 ， 将 康 威 的 某 些 言论 归 
纳 为 “ 康 威 定律 ".， 这 个 名 字 就 这 样 流传 了 下 来 。 虽 然 康 威 的 言论 在 当时 没有 得 到 实证 研究 的 文 
持 ， 但 是 近年 来 这 条 “定律 ” 却 吸 引 了 不 少 人 的 关注 。 本 章 包 侣 一 些 文 持 康 威 定律 的 证 据 ， 电 无 
疑问 这 些 证 据 如 来 出 现在 1967 年 的 话 , 会 帮 上 康 威 的 大 忙 。 而 在 今天 , 这些 证 据 的 价值 则 在 于 它 
们 证 明了 “ 康 威 定律 ”是 现代 软件 开发 人 员 的 试金石 。 

康 威 的 文 草 这 样 描述 这 个 理论 : 

任何 组 织 设计 出 来 的 系统 (此 处 指 广义 的 系统 ) 的 结构 都 会 照搬 这 个 组 织 的 沟通 








康 威 ?| 用 了 一 些 坊间 的 传闻 来 作证 : 茶 个 合同 研究 组 织 需要 编写 一 个 COBOL 和 一 个 ALGOL 
编译 副 ， 可 供 调 道 的 程序 员 共 有 8 人 。 在 对 难度 和 时 间 做 了 初步 的 合计 之 后 ，5 个 人 被 指派 去 写 
COBOL miz, 3NA ALGOL Eao SA, COBOL at HIS ITS TAR, ALGOL aE 
如 的 运行 分 3 个 步 又 。 

虽然 看 上 去 既 人 简单 又 不 能 作为 有 效 的 证 据 , 但 是 这 个 现实 世界 中 的 例子 却 让 人 印象 深刻 ， 让 
人 看 到 了 开发 团队 的 组 织 结 构 对 于 软件 设计 和 染 构 的 影响 。 

康 威 说 《哈佛 商业 评论 》 拒 绝 发 表 这 篇 文 草 ， 并非 针对 这 篇 文 草 , 更 多 地 表明 大 家 对 于 证 
明 ” 二 字 有 着 不 同 的 理解 ”。 
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从 1967 年 算 起 ,软件 工程 的 实证 研究 已 经 得 到 了 长 足 的 发 展 ,这 一 半 将 展示 一 些 重要 的 研究 ， 
这 些 人 研究 者 评估 了 康 威 定律 的 有 效 性 。 很 多 实证 研究 部 有 重大 的 缺陷 ， 没 有 一 个 是 完美 , 但 古 这 
些 研 究 都 是 按照 成 熟 的 指导 方针 来 实施 的 ， 所 以 我 们 有 理由 把 这 些 研究 的 成 东 作 为 有 力 的 证 据 ， 
证 明 将 软件 结构 对 应 到 组 织 结构 不 但 是 一 种 趋势 ， 而 且 还 非 第 有 必要 。 

任何 大 型 上 系统 都 是 由 入 小 一 些 的 子 系统 相互 连接 组 成 的 。 这 些 子 系统 又 可 以 锌 看 成 征 由 更 
小 的 模块 组 成 的 。 系 统 的 设计 征 由 模块 组 成 的 ， 每 个 模块 完成 一 部 分 的 功能 ， 并 连接 一 部 分 其 他 
的 模块 。 软 件 开 发 和 其 他 学 科 一 样 ， 使 用 接口 (interface) 这 个 术语 来 描述 模块 间 用 于 相互 连接 
的 机 制 ， 或 者 用 于 公开 模块 所 提供 的 功能 。 也 就 古 说 ， 系 统 可 以 被 摘 述 为 由 市 点 (模块 / 子 系 统 ) 
和 边 (以 接口 形式 存在 的 相互 连接 ) 组 成 的 图 。 

根据 系统 的 设计 起 源 ， 康 威 提出 了 自己 的 “证 明 *， 即 系统 的 结构 正好 反映 了 组 织 的 结构 。 
对 于 系统 中 的 任意 一 个 模块 (假设 为 x)， 我 们 都 能 够 在 组 织 中 识别 出 设计 它 的 那 群 人 (我们 称 这 
群 人 为 X) 。 也 就 是 说 ， 系 统 中 的 每 个 模块 都 有 一 个 与 乙 对 应 的 设计 团体 。 不 过 ， 需 要 注意 的 是 
两 者 之 间 并 不 一 定 是 一 一 对 应 的 关系 ， 因 为 同一 个 设计 团体 可 能 设计 多 个 模块 。 由 两 个 不 同 的 设 
计 团 体 (假设 为 X 和 Y) 分 别 设计 的 模块 或 者 子 系统 (假设 为 x- 和 y) 之 间 可 能 需要 做 连接 ， 也 可 
能 不 需要 。 如 采 需 要 做 连接 ， 那 么 X 和 Y 团 体 必 然 需 要 商量 并 确定 一 套 接 口 规范 ， 让 两 个 模块 可 
以 进行 沟通 。 如 采 不 需要 做 连接 ， 那 么 两 个 设计 团体 就 无 需 商量 ， 而 X 和 Y 之 间 也 就 没有 沟通 。 

也 就 是 说 ,至 少 在 开始 的 时 候 ， 系统 结 构 以 及 创建 它 的 组 织 的 结构 之 间 古 有 紧密 关联 的 。 不 
过 ， 软 件 与 开发 维护 软件 的 组 织 一 样 ， 是 不 断 变化 的 : 需求 会 变化 ， 团 队 之 间 的 人 员 会 有 调动 ， 
设计 也 会 有 改变 。 

虽然 康 威 的 理论 关注 于 软件 的 初始 设计 阶段 ,但 是 很 多 研究 人 员 发 现 ,这 个 现 角 在 后 期 阶段 
仍然 存在 。 所 以 ， 康 威 定律 就 有 了 一 个 可 能 的 推论 : 


系统 的 结构 能 和 开发 组 织 的 结构 高 度 对 应 的 软件 比 那 些 不 能 对 应 的 软件 要 “更 好 ” 
(广义 地 说 ) 。 


更 好 ”一 词 的 定义 根据 项 目的 背景 而 定 。 大 部 分 软件 开发 组 织 和 都 有 两 个 高 层次 的 目标 : 保 
持 高 效率 ， 同 时 保证 软件 质量 。 本 章 展 示 了 一 项 关于 康 威 定律 和 开发 人 员 完 成 任务 的 速度 〈 即 效 
率 ) 之 间 的 关系 的 研究 ， 以 及 另 一 项 关于 康 威 定律 如 何 影响 发 布 后 的 故障 〈 即 质量 ) 的 研究 。 两 
者 的 结 来 邦 文 持 康 威 的 判断 。 我 们 还 将 展示 一 项 对 5 个 著名 的 开源 软件 的 研究 ， 人 研 究 结 来 显示 ， 
在 任 其 自由 发 展 的 情况 下 , 一 个 成 功 的 软件 项 目 (至 少 在 开源 软件 这 个 领域 的 项 目 ) 的 沟通 结构 
津 弟 会 和 软件 的 结构 对 应 起 来 而 变 得 有 些 模块 化 。 

对 于 本 文中 包含 的 每 项 研究 ， 我 们 都 将 指出 其 背景 、 使 用 的 方法 、 研 究 结 末 以 及 相关 结论 。 
此 外 ,我 们 还 将 根据 我 们 的 结论 来 推荐 一 些 实用 的 方法 对 软件 项 目 进 行 改善 。 特 别 征 ,我们 认为 
不 应 该 让 程序 员 的 任务 分 配 来 决定 软件 结构 ， 因 为 这 样 很 危险 。 我们 应 该 首先 确定 我 们 需要 的 软 
件 结构 ， 再 相应 地 调整 我 们 的 组 织 结构 。 

我 们 支持 实证 主义 的 观点 , 即 证 明 一 个 理论 古 很 困难 的 , 但 十 在 我 们 每 次 笠 试 推翻 它 而 不 能 成 
功 的 时 候 , 我 们 对 它 就 更 多 一 点 信心 。 所 以 , 我 们 希望 本 革 能 增加 读者 对 康 威 定律 及 其 推论 的 信心 。 
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11.2 ”协调 工作 、 和 谐 度 和 效率 


在 2006 年 的 时 候 ，Marcelo Cataldo 等 人 “提出 了 一 个 问题 :“ 在 现实 世界 的 大 型 软件 项 目 中 ， 
协调 工作 对 效率 有 多 大 影响 ? ”这 个 问题 的 意义 很 明确 : 如 采 协 调 工 作对 效率 的 影响 很 大 ， 和 那么 
软件 开发 组 织 束 应 该 哆 尽 全 力 地 保证 协调 工作 的 进行 。 如果 协 调 工作 的 有 影 啊 不 大 , 组 织 束 应 该 把 
时 间 和 人 金钱 投资 到 项 目的 其 他 方面 ,如 更 多 的 人 手 、 更 好 的 设备 或 者 把 办 公 地 点 搬 到 经 济 更 发 达 
的 地 方 等 。 

为 了 回答 这 个 问题 ,他们 研究 了 一 家 大 型 公司 的 一 个 重要 项 目 中 的 工作 依赖 性 、 协 调 需 求 以 
及 完成 开发 任务 所 需要 的 时 间 。 这 个 项 目 用 修改 请 求 (Modification Request, MR) 来 代表 一 个 
任务 。MR 代 表 着 对 系统 的 一 切 修改 请 求 ， 包 括 添加 新 功能 、 修 复 问 题 以 及 改善 代码 库 的 维护 任 
务 。 完 成 MR 任务 的 团队 成 员 篆 第 需要 和 他 人 协调 进行 修改 ， 其 主要 原因 有 二 。 

口 有 的 MR 需要 依赖 其 他 MR。 比如 说 , 如果 某 个 MR 请 求 为 文字 处 理 如 加 入 检查 拼写 的 功能 ， 

那 它 束 必 须 等 到 添加 字典 功能 的 MR 完成 之 后 才能 进行 。 
O 软件 项 目 几 乎 总 是 由 一 些 相 互 依赖 的 模块 组 成 。 因 此 ， 对 于 系统 做 出 的 修改 很 少 是 孤立 
有 的， 这 些 修改 第 闸 会 影响 到 “周边 ”的 模块 。 

基于 这 些 原因 ，Cataldo 等 人 认为 ， 当 任务 的 依赖 关系 可 以 和 协调 工作 可 以 “相互 适应 ”时 ， 
完成 任务 就 会 更 容易 。 他 们 把 这 种 适应 性 称 之 为 和 话 度 ,并 从 大 型 软件 项 目 中 采集 了 数据 以 评估 
他 们 的 假说 。 虽然 看 上 去 似乎 比较 简单 ,但 是 如 何 衡 量 软件 团队 中 的 协调 活动 却 不 是 那么 容易 就 
能 解决 的 问题 。 实 证 研究 的 困难 有 一 半 都 是 在 于 找到 一 个 好 的 衡量 方法 , 这 个 方法 必须 可 以 基于 
当前 可 用 的 数据 来 进行 衡量 。Cataldo 等 人 制定 了 4 个 衡量 方法 , 以 便于 从 MR 中 找 出 软件 开发 者 的 
协调 和 谐 度 信息 。 这 些 方法 除了 分 析 团 队 之 间 的 直接 沟通 ， 还 会 分 析 团 队 中 有 利于 沟通 的 特征 。 
可 以 直接 观察 到 的 沟通 包括 MR 中 的 注释 信息 ， 以 及 互联 网 中 继 聊 天 (RC) 中 的 内 容 。 沟 通 的 
可 能 性 则 由 团队 成 员 的 地 理 距 离 以 及 组 织 内 的 职位 决定 。 四 个 和 谐 度 指标 如 下 。 

eHUU0U 

这 个 指标 代表 着 同一 个 团队 中 开发 人 员 的 协调 是 否 方便 。 我 们 有 足够 的 理由 相信 ,团队 

内 的 沟通 比 团队 间 的 沟通 更 容易 。 团 队 成 员 内 部 沟通 一 般 通 过 会 议 或 者 其 他 工作 相关 的 活 

动 。 他 们 通 第 相互 认识 并 且 曾 经 沟通 过 。 此 外 ， 正 是 因为 管理 者 认为 开发 人 员 的 工作 需要 相 

互 合作 ， 才 会 把 他 们 放 到 一 个 团队 里 的 。 

eHUU0U 

这 个 指标 把 开发 人 员 之 间 的 物理 距离 看 做 是 沟通 难度 的 代表 。 当 两 个 开发 人 员 在 同一 栋 

大 楼 工作 时 ， 他 们 要 联系 对 方 加 更 加 容易 ， 无 需 预约 ， 直 接 面 谈 或 者 随时 开 个 小 会 都 可 以 。 

而 且 在 同一 个 地 点 工作 的 人 之 间 也 不 存在 时 差 的 问题 。 此 外 ， 由 于 沟通 是 面对面 的 ， 所 以 沟 

通 层 面 也 更 加 丰 定 , 包括 面部 表情 等 暗示 都 会 成 为 沟通 的 一 部 分 。 他 们 可 以 在 白板 上 勾勒 出 

自己 的 想法 和 计划 , 或 者 一 起 坐 在 屏幕 前 看 代码 ， 这些 沟通 方式 对 于 距离 远 一 些 的 人 们 来 说 

吏 比 较 难 了 。 
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eHUUUU 

这 个 指标 衡量 在 MR 注释 中 的 沟通 。 在 Cataldo 所 人 研究 的 软件 项 目 中 ， 开 发 人 员 能 够 在 在 
线 MR 进 踪 系 统 中 为 MR 写 注释 以 便 让 其 他 人 了 解 这 个 MR。 这 样 ， 对 某 个 MR 感 兴 趣 的 开发 
人 员 之 间 就 可 以 进行 沟通 。 开 发 人 员 用 MR 注释 或 者 评论 的 方法 来 沟通 ， 不 但 代表 着 菜 种 程 
度 的 协调 ， 还 意味 着 他 们 交换 了 与 该 MR 相 关 的 技术 信息 。 
e IRCO OO OL 

这 个 指标 测量 开发 人 员 使 用 IRC (也 就 是 即时 通信 ) 进行 的 沟通 。 虽 然 IRC 不 如 面对面 
的 沟通 那么 丰富, 但 古 它 作为 一 种 同步 沟通 手段 ,可 以 帮助 开发 人 员 们 相互 提问 或 者 为 已 经 
协调 好 的 修改 任务 制 i] 计 划 。 除 了 他 本 人 以 外 ，Cataldo 额 外 蓄 请 了 两 个 评估 人 员 来 阅读 IRC 
对 话 记 录 ， 并 手动 把 它们 对 应 到 具体 的 MR。 为 了 确保 评估 标准 的 统一 性 ， 三 个 评估 者 同时 
对 10%H 鸭 MR 进行 了 对 应 ， 而 其 结 采 鸭 相 同 程 度 高 达 97.5%， 也 就 是 说 IRC 到 MR 的 对 应 是 比 
较 准 确 的 。 


这 个 软件 项 目 包括 144 名 开发 人 员 ， 他 们 分 别处 在 8 个 团队 ， 而 这 些 团 队 又 分 布 在 3 个 不 同 的 
位 置 。 数 据 收集 涵盖 了 3 年 时 间 和 4 个 发 行 版 本 。 这 一 研究 方法 的 关键 在 于 观 罕 每 个 开发 人 员 分 配 
到 的 任务 ， 以 及 每 个 任务 的 依赖 关系 。 如 琳 张 三 正在 进行 任务 tl ， 而 这 个 任务 需要 依赖 任务 世 ， 
而 忆 又 是 由 村 四 来 做 的 ， 那么 张 三 和 李 四 就 可 能 需要 进行 协调 。Cataldo 每 人 使 用 的 方法 是 : 找 出 
MR 征 谁 完 成 的 ， 以 及 在 完成 MR 时 修改 了 哪些 文件 。 也 丈 征 说 ， 开 发 人 员 的 任务 就 征 一 组 文件 。 
通 闻 来 说 ， 完 成 一 个 MR 需 要 修改 多 个 文件 。 然 后 ， 计 算 有 多 少 次 是 同时 修改 两 个 文件 来 完成 一 
个 MR 的 ， 就 能 得 出 两 个 文件 之 间 的 相互 依赖 度 。 有 具体 来 说 ， 束 是 如 末 文 件 人 和 人 在 过 去 曾经 多 
次 被 同时 修改 来 完成 MR,， 并 且 张 三 需要 修改 科 来 完成 他 的 MR 而 李 四 又 需要 修改 亿 来 完成 目 己 的 
MR， 那 么 对 他 们 来 说 沟通 可 能 就 很 有 必要 了 了。 

当 需 要 完成 MR 时 ， 我 们 可 以 用 这 些 规律 来 确定 我 们 预期 会 发 生 的 协调 工作 。 而 Cataldo 使 用 了 
之 前 介绍 的 四 个 方法 视 出 了 开发 人 员 之 则 的 实际 协调 规律 。 如 来 预期 和 实际 发 生 的 协调 工作 紧密 吻 
Ao 那么 和 谐 度 就 高 ， 反 之 如 来 预期 的 协调 没有 发 生 ， 那 么 和 谐 度 就 低 。 他 们 使 用 这 个 方法 来 计算 
了 每 个 MR 的 每 种 四 种 和 谐 度 ， 然 后 调 碍 了 每 个 MR 的 每 种 和 谐 度 及 其 完成 时 间 之 间 的 关系 。 

四 种 形式 的 协调 代表 了 鳌 个 开发 组 织 的 沟通 机 制 。 可 以 从 一 个 比较 高 的 角度 来 看 待 Cataldo 
等 人 问 的 这 个 问题 ， 即 :“ 如 采 软 件 结 构 和 组 织 的 沟通 结构 相对 应 的 话 ， 任 务 征 不 征 藉 完 成 得 更 
快 ? ”如 东 答 和 案 征 “ 征 ， 那 么 我 们 就 可 以 把 这 个 答案 作为 证 据 ， 证 明 齐 守 康 威 定律 会 市 来 更 高 
的 效率 ， 也 会 从 完成 任务 时 间 的 角度 证 明 ， 康 威 的 推论 确实 是 正确 有 的 。 

在 研究 中 ，Cataldo 等 人 还 严密 控制 了 一 些 会 影响 MR 气 成 时 间 的 因素 。 比 如 ， 必 须 等 到 很 多 
其 他 的 MR 完 成 之 后 才能 进行 的 MR 的 完成 时 间 会 长 一 些 ， 而 优先 级 较 高 的 MR 一 般 来 说 会 完成 得 
更 快 。 总 的 来 说 ， 他 们 对 以 下 这 些 因素 进行 了 控制 : 依赖 关系 、 优 先 级 、 工 作 调动 、 需 要 修改 的 
文件 数量 、MR 的 来 源 〈 内 部 或 客 忆 提 出) 、 负 责 MR 的 开发 人 员 的 经 验 〈 如 编程 的 经 验 、 进 入 公 
司 的 时 间 以 及 在 该 MR 相关 的 组 件 上 工作 的 时 间 )、MR 所 在 的 发 行 版 本 以 及 开发 人 员 的 工作 人 负 奏 
( 即 同 时 指派 的 其 他 MR 的 数量 ) 等 。 这样, 就 可 以 避免 直接 对 比 实际 情况 差距 很 大 的 两 个 MR (EE 
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如 初始 开发 阶段 、 由 新 手 执 行 的 低 优先 级 MR 以 及 一 个 维护 阶段 、 由 老手 执行 的 高 优先 级 MR ) 
的 执行 时 间 。 如 采 不 对 比 这 些 育 景 情况， 那么 最 后 得 出 的 结论 束 可 能 是 “协调 工作 不 到 位 延长 
了 MR 的 完成 时 间 ， 而 真正 的 原因 却 可 能 是 经 验 不 足 或 者 项 目 所 处 的 阶段 问题 。 这 种 严谨 的 态度 
和 对 细 市 的 注意 让 这 项 研究 的 结 采 更 好 地 反应 了 现实 世界 的 情况 , 而 不 仅仅 是 一 堆 靠 不 住 的 统计 
数据 。 

在 经 过 仔细 的 量化 分 析 之 后 (具体 细 慷 此 处 不 表 ， 有 兴趣 的 读者 请 阅读 该 论文 的 完整 版 )， 
研究 人 员 们 发 现 , 在 背景 情况 相似 的 前 提 下 ， 高 和 谐 度 (或 者 说 “协调 适合 度 ”) 的 MR 所 需要 的 
时 间 比 低 和 谐 度 的 少 。 

有 趣 的 是 ， 结 构 和 谐 度 ( 即 和 团队 结构 有 关 的 和 谐 度 ) 对 于 减少 MR 所 需 时 间 的 贡献 最 大 ， 
其 次 是 地 理 和 谐 度 〈 即 需要 合作 的 开发 人 员 的 距离 ) 。 

另 一 个 重要 的 发 现 生 版 本 越 乱 后 ， 耻 C 和 谐 度 影 响 越 大 。 图 11-1 显 示 ， 软 件 的 架构 可 能 会 随 
着 时 间 的 推进 而 产生 改变 ， 结 构 和 语 度 的 下 降 昔 味 着 需要 多 个 团队 才能 合作 解决 的 MR 增多 。 而 
由 于 下 C 沟 通 可 以 降低 跨 团 队 协 调 的 难度 ， 所 以 ， 了 下 C 和 谐 度 变 强 也 有 可 能 意味 着 开发 人 员 在 项 
目 后 期 可 以 更 熟练 地 使 用 IRC 来 和 不 同 团队 及 工作 地 后 的 同事 协调 工作 。 

版 本 平均 和 谐 度 




















版 本 1 版 本 2 版 本 3 版 本 4 
11-1 每 个 版 本 的 平均 和 谐 度 


给 我 们 的 局 示 


我 们 已 经 知道 了 很 多 , 但 是 这 些 对 于 你 的 项 目 来 说 有 什么 意义 ? 对 于 个 和 案 研究 来 说 , 重要 的 
征 找 出 其 普 志 适用 性 。 如 采 要 将 研究 的 结论 推广 到 其 他 项 目 ,， 那 么 这 些 项 目 和 研究 对 象 就 必须 起 
相似 的 。 笠 运 的 征 ，Cataldo 等 人 研究 的 软件 项 目 非 常 庞大， 共有 超过 100 名 开发 人 员 以 及 成 千 上 
万 的 文件 和 任务 〈 即 MR) 。 这 个 项 目 由 分 布 在 不 同 工 作 地 点 的 多 个 团队 共同 进行 开发 ， 研 究 的 时 
旧 段 也 从 初始 版 本 一 直 延 续 到 后 续 几 个 版 本 。 所 以 ,我们 对 于 该 研究 结果 在 软件 开发 中 的 普遍 适 
用 性 还 下 比较 有 信心 的 。 
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虽然 你 无 法 预知 软件 会 出 现 哪 些 bug 或 者 需要 哪些 新 功能 ， 但 征 在 软件 的 设计 阶段 ， 还 是 应 
该 对 可 能 产生 紧密 依赖 关系 的 部 分 有 所 认识 。 这 种 存在 于 组 件 之 间 的 紧密 依赖 关系 意味 着 如 琳 协 
调 没 做 好 , 那么 系统 的 这 些 部 分 就 可 能 会 受到 较 大 的 影响 。 我 们 在 为 开发 人 员 及 团队 进行 任务 分 
配 的 时 候 , 应 该 尽量 做 到 方便 参与 开发 的 各 方 进行 沟通 , 尤其 定 相 互 依赖 的 组 件 的 开发 人 员 之 辣 
的 沟通 。 也 就 古 说 , 我们 最 好 在 设计 完成 之 后 再 确定 团队 的 结构 ,或 者 至 少 保 证 团队 有 的 结构 有 一 
定 的 弹性 。Cataldo 等 人 注意 到 结构 和 谐 度 会 随 着 时 间 的 推移 而 下 降 , 这 表明 团队 结构 和 代码 依赖 
关系 之 间 的 对 应 关系 改变 了 。 在 版 本 交 蔡 的 时 候 重新 组 织 团 队 ， 这 样 就 能 提高 结构 和 谐 度 ， 并 缩 
于 MR 的 解决 时 间 。 同 样 ， 分配 任 务 时 我 们 还 应 该 考虑 地 理 位 置 的 因素 。 我 们 应 该 尽量 将 相互 依 
赖 度 较 高 的 组 件 交 给 同一 个 工作 地 点 的 开发 人 员 或 者 团队 , 这 样 他 们 就 可 以 用 更 多 的 方式 来 进行 
协调 。 

MR 和 IRC 和 谐 度 则 更 加 地 动态 ， 会 随 着 项 目的 推进 而 改变 。 有 一 瓜 人 很 明确 ， 那 就 是 在 解决 
未 个 MR 的 时 候 用 注释 进行 协调 的 开发 人 员 越 多 ， 解 决 的 速度 就 会 越 快 。 我 们 应 该 宣传 和 鼓励 这 
样 的 沟通 方式 。 当 前 的 研究 课题 主要 和 古 使 用 工具 来 帮助 开发 人 员 及 管理 者 找 出 缺少 这 类 协调 的 任 
务 ， 并 确定 相应 组 织 协调 工作 的 人 员 。 此 外 , 开发 组 织 应 该 积极 采取 更 好 的 沟通 工具 ， 以 便于 进 
行路 地 域 和 跨 组 织 的 协调 工作 。 在 项 目 开始 之 前 就 对 这 类 沟通 工具 和 技术 进行 投资 , 那么 受制 于 
协调 需求 的 任务 就 会 减少 ， 效 率 也 能 得 到 提高 。 
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我 们 探讨 了 康 威 推论 对 于 开发 人 员 效 率 的 影响 ， 并 分 析 了 如 何 使 用 “和 谐 度 ”(Cataldo 创 造 
的 术语 ， 即 符合 康 威 推论 的 程度 ) 来 帮助 程序 员 更 快 地 完成 任务 。 对 于 任何 软件 开发 项 目 来 说 ， 
另 一 个 不 能 忽视 的 重点 是 质量 。 我 们 都 知道 ， 发 现 缺 陷 的 时 间 越 晚 ， 修 复 成 本 就 越 高 。 在 软件 已 
经 正式 发 布 之 后 发 现 的 缺陷 会 带 来 巨大 的 损失 , 所 以 我 们 必须 将 这 种 可 能 最 小 化 。 这 样 的 缺陷 所 
带 来 的 损失 并 不 一 定 只 是 金钱 上 的 ， 当 用 户 在 软件 中 发 现 bug 的 时 候 ， 他 们 对 于 产品 整体 质量 和 
公司 名 誉 的 看 法 都 会 下 降 ， 会 对 公司 市 场地 位 造成 无 法 磨灭 的 影响 。 

因为 缺陷 的 相关 成 本 很 高 , 而 康 威 又 下 过 这 样 的 断言 , 所 以 Nachi Nagappan, Brendan Murphy 
和 Vic Basili 三 人 对 Windows Vista 的 组 织 结 构 和 发 布 后 的 缺陷 进行 了 深入 的 研究 ”“。 研 究 发 现 ， 两 
者 之 间 有 着 惊人 的 强烈 关联 。 他 们 发 现实 际 上 对 组 织 结 构 的 度量 才 是 决定 软件 质量 的 关键 因素 ， 
比 软件 本 身 的 任何 特质 都 要 重要 。 举 个 简单 的 例子 ， 就 Windows Vista 而 言 ， 如 果 你 想 知 道 某 个 软 
件 组 件 是 否 存 在 bug, 你 可 以 不 去 看 代码 , 直接 去 看 编写 这 个 组 件 的 开发 人 员 的 组 织 方 式 就行 了 。 

他 们 研究 的 核心 前 提 是 : 软件 开发 是 一 项 需要 集体 努力 的 工作 ,而 组 织 层面 的 复杂 性 会 计 协 
调 工作 变 得 困难 。 对 于 实证 研究 来 说 , 都 必须 把 具体 的 现象 抽 丝 剥 曹 , 变 成 可 衡量 的 东西 。 不 过 ， 
衡量 软件 的 质量 还 是 很 容易 的 。Windows Vista 包 含 成 千 上 万 个 “二 进 制 文件 ”， 即 编译 好 的 代码 。 
这 些 文件 包括 可 执行 文件 (.exe)、 共 享 库 文件 (.dll) 以 及 驱动 程序 (.sys)。 一 旦 某 个 组 件 出 现 
故障 ， 系 统 就 会 分 析出 造成 故障 的 二 进 制 文件 ， 并 发 送 错误 报告 到 微软 ，( 记 得 当 程 序 崩 涡 时 出 
现 的 搞笑 对 话 框 吗 ?) 然后 微软 可 以 用 这 些 报告 来 确定 bug 修 复 的 优先 级 。 他 们 利用 这 些 信息 ， 



































144 第 11 章 康 威 推论 


与 其 他 的 bug 报 告 和 相关 的 修正 数据 ， 来 判断 每 个 二 进 制 文件 出 错 的 可 能 性 。 为 了 评 佑 康 威 推论 
的 效 坟 ，Nagappan 把 Vista 中 的 每 个 二 进 制 文件 部 分 为 两 种 ， 即 容易 出 错 或 者 不 容易 出 错 , 分 类 基 
于 二 进 制 文件 中 不 同 错误 的 数量 。 需要 注意 的 是 即便 有 成 二 上 万 个 用 户 发 送 崩 涡 报 告 ,只 要 是 这 
些 朋 江都 是 由 一 个 缺陷 引起 的 ,就 只 算 作 一 个 缺陷 。 也 就 古 说 ， 出 错 倾 钻 是 用 于 衡量 菜 个 二 进 制 
文件 中 的 已 知 缺陷 数量 的 指标 。 
测量 组 织 复杂 度 要 稍微 困难 些 。Nagappan、Murphy 和 Basili 提 出 了 组 织 复杂 度 的 8 个 度量 法 ， 
并 人 研 究 了 各 个 度量 法 和 错误 倾 加 之 间 的 相关 性 , 并 在 控制 其 他 指标 效 末 的 前 所 下 , 利用 了 回归 模 
型 来 分 析 对 比 各 个 指标 的 效 末 。 他 们 使 用 了 版 本 控制 系统 中 的 数据 来 确定 哪些 开发 人 员 修 改 了 源 
文件 。 从 编译 信息 中 可 以 找 出 用 于 编译 每 个 二 进 制 文件 的 源 代 码 文 件 。 为 简洁 起 见 ， 如 采 茶 个 开 
发 人 员 修 改 了 采 个 二 进 制 文件 对 应 的 产 代 码 文件 ， 那 融 认 为 他 修改 或 者 插手 了 这 个 二 进 制 文件 。 
Nagappan、Murphy 和 Basili 还 从 公司 的 结构 图 中 搜集 数据 ， 以 便 识别 开发 人 员 的 组 织 关 系 。 
这 套 度 量 法 所 使 用 的 信息 都 是 来 自 上 述 来 产 , 没有 使 用 其 他 信息 。 这 8 个 组 织 结构 指 标 如 下 所 示 。 
e 0000000 
这 个 指 慰 指 的 是 修改 了 茶 个 二 进 制 文件 并 且 仍 在 在 本 公司 任职 的 开发 人 员 数 量 。 我 们 预 
计 这 个 指标 越 高 ， 二 进 制 文件 就 越 容易 出 错 。 我 们 的 这 个 判断 是 基于 Brooks 的 结论 ， 即 如 
本 菏 个 组 件 的 开发 人 员 有 7 个 , 那么 他 们 之 同 就 存在 xz-1/2 条 可 能 的 沟通 渠道 。 当 软件 团队 
的 规模 至 线性 增长 时 ,沟通 成 本 却 不 会 只 是 线性 增长 ， 而 征 要 快 得 多 。 当 沟通 的 渠道 越 来 越 
多 ,那么 就 有 可 能 市 来 各 种 问题 ， 比 如 协调 的 问题 ,设计 和 实现 的 不 匹配 回 题 , 破坏 别人 代 
码 的 问题 以 及 对 设计 和 初 囊 的 误解 等 。 所 以 ， 我们 认为 二 进 制 文件 对 应 的 开发 人 员 越 多 ,那么 
省 误 也 就 越 多 。 
e 00000000L 
这 个 指标 指 的 是 修改 了 茶 个 二 进 制 文件 但 又 在 正式 发 布 之 前 离开 了 公司 的 开发 人 员 数 
量 。 我 们 认为 这 个 指标 越 高 ， 问 题 就 越 多 。 这 个 指标 评 佑 的 是 所 需 转 移 的 知识 量 。 当 茶 个 二 
进 制 文件 的 开发 人 员 离职 的 时 候 , 另 一 个 对 这 些 代 码 经 验 较 少 的 开发 人 员 就 可 能 会 项 蔡 他 的 
工作 。 新 的 开发 人 员 很 可 能 不 像 原 来 的 那 位 一 样 了解 组 件 设 计 、 关 于 bug 修 复 的 各 种 考量 以 
及 这 些 代码 所 涉及 的 其 他 人 员 。 这 就 会 增加 出 错 的 可 能 性 ， 以 及 引入 缺陷 的 可 能 性 。 
*HUUU 
(EBM Se E SC PP OER, MERRE SST ARK, Wee, 
每 次 修改 都 是 版 本 控制 系统 中 的 一 个 独立 的 版 本 提交 。 r EARRA AEA Ji tt FE Ze 
现 。 如 琳 某 个 二 进 制 文件 修改 太 多 次 ， 那 么 就 有 可 能 意味 着 代码 的 稳定 性 或 者 控制 性 不 强 ， 
即便 这 些 修改 都 是 由 某 一 小 群 开发 人 员 做 的 。 我 们 可 以 把 这 个 指标 和 开发 人 员 数 量 以 及 离职 
开发 人 员 数量 相 结 合 ， 这 样 就 能 看 到 更 为 全 面 的 修改 分 布 情况 。 比 如 ,年 不 是 大 部 分 修改 都 
征 由 茶 一 个 开发 人 员 做 的 , 还 是 说 这 些 修改 者 的 分 布 非常 广泛 ? 把 开发 人 员 和 修改 数量 关联 
起 来 , 可 以 避免 这 样 一 种 情况 , 那 束 是 少数 的 开发 人 员 做 了 几乎 所 有 的 修改 。 在 这 种 情况 下 ， 
指标 就 会 出 问题 ,更 会 导致 错误 的 结论 。 
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e [] | O UULU U Depth of Master Ownership[] DMOL 

这 个 指标 评估 的 是 某 个 二 进 制 文件 的 相关 任务 在 组 织 内 的 分 布 有 多 广泛 。 对 于 任意 一 个 
二 进 制 文件 , 组 织 内 的 每 个 人 都 有 一 个 对 应 的 修改 次 数 , 这 个 次 数 包括 他 对 这 个 文件 做 出 的 
修改 次 数 ， 再 加 上 他 的 每 个 下 级 对 这 个 文件 的 修改 次 数 。 换 言 之 ,每 个 开发 人 员 所 做 的 修改 
次 数 会 在 他 们 的 管理 者 那里 汇总 ， 并 加 上 管理 者 自己 的 修改 次 数 。DMO 是 指 修改 次 数 占 总 
数 75% 以 上 的 人 即 该 二 进 制 文件 的 主人 负责 人 ) 在 组 织 内 的 最 低级 别 。 这 个 指标 越 高 ， 组 织 
中 的 主 负责 人 等 级 就 越 低 ( 即 越 深 )。 我 们 认为 ， 这 个 指标 越 高 ， 故 障 就 会 越 少 。 对 于 某 个 
二 进 制 文件 来 说 ， 如果 大 部 分 的 修改 都 是 由 一 群 组 织 等 级 相近 、 从 属于 同一 个 管理 者 的 开发 
人 员 人 负 贡 的 ， 那 么 这 个 较为 基层 的 省 理 者 就 对 这 个 二 进 制 文件 人 负 贡 ， 而 DMO 也 就 会 很 高 。 
这 束 意 味 着 某 个 二 进 制 文件 的 相关 开发 人 员 都 联系 紧密 ， 并 且 协 调 工 作 无 需 组 织 内 高 层 参 
与 。 如 果 从 比较 高 级 别管 理 者 中 才能 找 出 负责 75% 的 提交 的 人 ， 那 么 谁 才 是 负责 人 就 不 那么 
明显 了 ， 而 修改 也 是 由 组 织 内 多 个 不 同 的 部 分 做 出 的 。 这 就 可 能 造成 决策 方面 的 问题 ， 因 为 
有 多 方 参与 修改 ， 而 每 方 的 目标 又 有 不 同 。 而 由 于 高 层 管 理 者 要 管理 的 人 很 多 ， 负 稼 无 法 参 
SRA LYE, TR BAER, Faker BC HF 
e 000000000 

这 个 指标 指 的 是 回报 给 主 负 责 人 〈 见 前 一 个 指标 ) 的 开发 人 员 所 占 组 织 总 人 数 的 比例 。 
如 东 组 织 中 有 100 个 人 在 开发 某 个 二 进 制 文件 ， 其 中 25 个 人 直接 汇报 给 主 负 责 人 ， 那 么 这 个 
指标 的 值 就 是 0.25。 我 们 认为 ， 这 个 指标 的 值 越 低 ， 就 意味 着 二 进 制 文 件 的 错误 率 越 低 。 这 
个 指标 和 和 DMO 相辅相成 ， 用 于 考量 不 平衡 的 组 织 ， 比 如 ， 组 织 中 有 两 个 管理 者 ， 但 是 一 个 
手下 有 50 个 人 ， 而 另 一 个 只 有 10 个 人 。 指 标的 值 越 低 ， 就 说 明 二 进 制 文件 的 责任 更 集中 ,也 
就 是 说 跨 组 织 协调 工作 的 需求 就 越 少 。 
e DDUUUUUUD 

这 个 指标 指 的 是 负责 茶 个 二 进 制 文件 的 部 门 对 这 个 文件 做 出 的 修改 量 占 其 总 修改 量 的 
百分比 ， 如 采 疫 有 专门 负责 的 部 门 ， 那 么 就 把 修改 量 最 大 的 部 门 作 为 负责 部 门 。 这 个 值 越 高 
越 好 。 不 同 部 门 往 往 会 在 目标 、 工 作 方 法 和 文化 上 有 所 不 同 。 要 进行 跨 部 门 的 协调 工作 就 必 
须 处 理 这 些 分 歧 ， 也 就 更 容易 出 现 不 成 功 的 构建 、 同 步 问 题 以 及 代码 错误 等 问题 。 如 果 二 进 
制 文件 有 专门 的 负 贡 部 门 ， 那么 大 部 分 的 修改 都 应 该 由 这 个 部 门 做 出 。 即 便 没 有 明确 的 负 贡 
部 门 ， 如 果 大 部 分 的 修改 都 是 由 某 一 个 部 门 做 出 的 ， 那 么 结果 也 应 该 更 好 。 
e 070000 

这 个 指标 是 修改 某 个 二 进 制 文 件 并 报告 给 主要 负责 人 的 开发 人 员 数 量 , 和 所 有 修改 过 这 
个 文件 的 开发 人 员 数 量 的 比例 。 我 们 认为 这 个 值 越 高 ， 错 误 就 越 少 。 如 采 大 部 分 做 修改 的 开 
发 人 员 都 是 由 这 个 负责 人 来 管理 的 , 那么 大 部 分 协调 工作 的 学 围 就 被 限定 在 了 这 个 管理 者 的 
旗下 ， 那 么 协调 失灵 的 情况 就 会 变 少 。 这 个 指标 作为 DMO 的 补充 ， 即 较 低 的 DMO (AE) 
有 可 能 会 和 较 高 的 部 门 总 责任 等 级 《有 利 ) 相互 抵消 。 
*HUUUU 

这 个 指标 是 指 对 某 个 二 进 制 文件 至 少 提 交 了 10% 的 修改 的 部 门 数 量 。 这 个 值 越 高 ,说明 
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二 进 制 文件 的 部 门 分 布 越 广 , 而 我 们 认为 这 将 导致 更 多 的 故障 。 当 修改 革 个 二 进 制 文件 的 部 
门 数 量变 多 时 ， 就 难以 找 出 主要 负 贡 的 部 门 。 而 修改 这 个 文件 的 组 织 之 间 ， 也 可 能 会 有 相互 
冲突 的 目标 。 而 这 个 文件 需要 多 个 部 门 来 修改 ,也 可 能 表明 它 是 系统 的 染 构 中 很 重要 的 “ 连 
TEAL 。 


这 些 指标 部 考量 单个 二 进 制 文件 的 组 织 性 复杂 度 。 较 高 的 组 织 性 复杂 度 意味 着 组 织 结构 和 软 
件 结构 很 不 一 致 。 如 来 我 们 根据 康 威 定律 做 出 的 推论 古 正 确 的 , 那么 当 社 会 和 技术 结构 更 “ 搭 调 ” 
的 时 候 ， 就 能 够 产生 更 好 的 结 采 。 
那么 ， 在 对 Windows Vista 的 发 布 后 故障 的 研究 中 ， 这 些 指标 是 人 否 好 用 ? 为 了 回答 这 个 问题 ， 
Nagappan、Murphy 和 Basili 使 用 了 一 种 逐 辑 回归 的 量化 分 析 法 。 逻 辑 回 归 采 用 一 系列 相互 独立 的 
变量 作为 输入 ， 并 输出 一 个 分 类 。 在 这 个 案例 中 ， 他 们 计算 了 每 个 二 进 制 文件 的 复杂 度 指 标 ， 作 
为 独立 的 变量 。 他 们 使 用 了 发 布 后 的 故 隐 数据 来 将 二 进 制 文件 分 为 容易 出 错 和 不 容易 出 错 的 ， 然 
后 用 逻辑 回归 来 判断 这 些 独立 的 变量 《〈 即 复杂 度 指 标 ) 和 分 类 ( 即 是 否 容 易 错误 ) 之 间 有 没有 关 
联 。 此 外 ,使 用 这 个 分 析 法 的 话 ， 我 们 还 可 以 在 消除 其 他 复杂 度 指标 的 影响 的 前 提 下 ， 找 出 单个 
复杂 度 指标 和 出 错 倾 问 之 间 的 关联 性 。 
这 有 一 扩 类 似 于 人 研究 某 个 人 的 年 龄 和 里 高 对 于 他 的 体重 的 影 啊 。 如 琳 我 们 分 析 年 龄 和 体重 之 
旧 的 关联 ， 那 么 就 会 发 现 它 们 之 间 有 着 强烈 的 联系 ， 壬 高 和 体重 也 是 如 此 。 但 是 ， 如 来 我 们 只 
究 茶 个 固定 身高 的 人 群 ， 就 会 发 现年 龄 和 体重 几乎 没有 什么 关系 〈 平 均 来 说 ，6 英 尺 的 美国 男人 
的 体重 差不多 虱 在 210 磅 左右 ， 无论 他 是 30 岁 还 是 60 岁 )。 逻 辑 回归 还 可 以 用 来 做 预测 。 我 们 可 以 
对 逻辑 回归 进行 “训练 .， 比 如 用 一 群 已 知 年 龄 、 映 高 和 体重 的 人 的 数据 ， 来 预测 茶 个 已 知 年 龄 
和 坊 高 的 人 的 体重 。 
Nagappan、Murphy 和 Basili 的 人 研究 统计 结 末 显 示 ， 八 种 复杂 度 的 指标 都 对 错误 有 统计 上 显著 
的 效 末 ， 即 便 生 将 他 们 进行 槛 癌 对 比 也 征 一 样 。 也 束 是 说 ， 菏 个 二 进 制 文件 的 离职 开发 人 员 的 数 
量 越 高 ， 这 个 文件 的 错误 也 束 越 多 ， 即 使 不 考虑 其 他 的 影响 因 北 ， 如 开发 人 员 总 数 、 主 负责 人 琛 
度 等 。 这 表明 不 但 复 洒 度 指标 和 发 布 后 的 缺陷 有 关联 ， 而 且 每 个 指标 所 衡量 的 东西 部 有 所 不 同 。 
下 一 步 ，Nagappan、Murphy 和 Basili 尝 试 着 用 复杂 度 指标 来 预测 容易 出 错 的 二 进 制 文件 。 做 
预测 比 起 单纯 的 找 关 联 来 说 要 困难 得 多 , 因为 有 很 多 因素 都 可 能 影 啊 最 终 的 结 来 。 人 们 可 以 确定 
年 龄 和 重量 之 间 有 强烈 的 关联 , 但 是 这 并 不 代表 可 以 在 只 知道 年 龄 的 情况 下 锥 确 地 预测 体重 。 不 
过 , 这 群 研究 人 员 意 外 地 发 现 , 复杂 度 指标 其 实 可 以 准确 地 预测 二 进 制 文件 的 出 错 倾 钻 。 EKE, 
组 织 性 复杂 度 指标 比 起 已 知 的 准确 性 高 的 源 代 码 特 性 预测 指标 (如 代码 行 数 、 圈 复杂 度 、 依 赖 关 
A. AEWRE ET) 都 要 好 。 
要 对 比 不 同 的 预测 方法 的 准确 性 ， 可 以 使 用 标准 的 查 准 这 和 查 全 滨 分 析 法 。 
D EER: 在 这 个 案例 中 ， 查 准 率 代表 着 使 用 茶 个 预测 方法 预测 为 容易 出 错 的 二 进 制 文件 
有 多 少 确实 容易 出 错 。 如 琳 这 个 值 低 就 意味 着 有 很 多 误 报 ， 即 被 预测 为 容易 出错 的 二 进 
制 文件 实际 上 并 不 容易 出 错 。 

口 查 全 率 : 查 全 率 意味 着 有 多 少 容易 出 错 的 二 进 制 文 件 被 预测 出 来 了 。 如 果 这 个 值 低 ， 意 
味 着 有 很 多 本 来 很 容易 出 错 的 二 进 制 文件 被 错误 地 预测 为 不 容易 出 错 。 
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ANAS AT HEAT, 我 们 想 尽 可 能 地 增 大 查 准 率 和 查 全 率 。 理想 的 预测 方法 应 该 可 以 预测 出 所 有 
真正 容易 出 错 的 二 进 制 文件 ,但 古 又 不 会 错误 地 包含 不 容易 出 错 的 文件 。 表 11-1 为 用 组 织 结构 回 
归 模 型 来 做 预测 的 查 准 率 和 查 全 率 ， 并 有 其 他 源 代 码 相 关 的 指标 的 预测 结 末 作为 对 比 。 


表 11-1 预测 准确 度 








预测 方法 E 准 率 查 全 率 
组 织 结构 86.2% 84.0% 
代码 变更 78.6% 79.9% 
代码 复杂 度 79.3% 66.0% 
依赖 关系 74.4% 69.9% 
代码 覆盖 率 83.8% 54.4% 
发 布 前 的 bug 73.8% 62.9% 
给 我 们 的 启示 





这 些 结果 的 音义 在 哪儿 ?首先 , 在 Windows Vista 的 开发 中 , 很 明显 组 织 复 杂 度 和 发 布 后 的 缺 
陷 有 着 强烈 的 关联 。 这 些 结果 证 实 了 我 们 的 推论 ， 即 (至 少 在 Windows Vista 的 开发 中 ) 当 沟 通 和 
协调 的 结构 和 软件 结构 符合 的 时 候 ， 软 件 就 “更 好 ”。 当 来 自 不 同 组 织 的 开发 人 员 开 发 同一 个 二 
进 制 文件 的 时 候 ， 这 个 文件 就 更 容易 出 错 。 对 这 种 情况 我 们 可 以 做 很 多 解释 。 比 如 ， 开 发 人 员 如 
RAFAT, 他 对 二 进 制 文件 的 相关 知识 就 随 之 带 走 了 ， 而 主要 负责 人 深度 越 低 ， 就 意味 着 开发 
同一 个 二 进 制 文件 的 开发 人 员 必 须 通 过 高 层 管理 者 来 进行 沟通 , 会 带 来 沟通 成 本 、 延 迟 以 及 信息 
缺失 等 问题 。 

Nagappan, Murphy 和 Basili 并 没有 确定 究竟 哪些 因素 造成 了 发 布 后 的 缺陷 。 对 于 Windows Vista 
这 种 级 别 的 项 目 来 说 ， 这 种 想法 太 难 实现 了 ， 而 且 经 济 上 也 不 允许 。 比 如 说 ， 这 可 能 会 需要 一 个 
类 似 于 “临床 ”对 比试 验 一 样 的 环境 , 一 组 开发 人 员 在 组 织 结构 最 简化 的 环境 中 开发 一 个 操作 系 
统 ， 而 男 外 一 个 对 照 组 的 开发 人 员 则 在 更 传统 、 目 前 常见 的 组 织 结构 下 开发 同样 的 系统 。 

虽然 没有 详细 的 因果 分 析 , 但 是 我 们 仍然 能 从 这 些 结果 中 得 到 不 少 收获 。 如 果 研 究 人 员 认 为 
组 织 复 杂 度 和 发 布 后 缺陷 之 间 有 因果 关系 ,那么 他 们 就 可 以 尽量 去 降低 复杂 度 。 比 如 ， 与 其 让 组 
组 的 所 有 人 都 来 修改 一 个 二 进 制 文件 , 不 如 明确 地 任命 一 个 负责 团队 , 这 个 团队 可 以 监管 这 个 二 
进 制 文件 或 者 审查 提交 上 来 的 代码 。 由 于 每 个 软件 项 目 都 会 存在 相互 依赖 关系 的 问题 ,所 以 我 们 
无 法 完全 避免 高 组 织 复杂 度 的 组 件 , 但 是 可 以 提前 识别 出 这 些 组 件 。 在 开发 的 早期 就 把 这 些 组 件 
的 接口 稳定 下 来 ,有 助 于 减轻 组 织 复 杂 度 在 中 后 期 所 带 来 的 负面 影响 。 对 于 可 能 出 错 的 二 进 制 文 
件 的 预测 可 以 用 于 指导 开发 后 期 对 测试 资源 的 分 布 , 这 样 就 可 以 尽量 照顾 那些 更 容易 在 发 布 后 出 
现 错误 的 组 件 。 

这 些 研 究 结果 有 多 可 信 ? 要 想 回答 这 个 问题 我 们 必须 了 解 研 究 的 背景 。 这 个 研究 对 比 了 具有 
不 同 特征 的 软件 组 件 〈 二 进 制 文件 ) ， 但 是 这 些 组 件 都 属于 同一 个 软件 项 目 。 这 样 的 方法 避免 了 
很 多 干扰 因素 ， 因 为 相对 于 两 个 不 同 项 目 之 间 的 对 比 来 说 ,这 样 的 对 比 更 加 地 对 等 。 试 图 用 分 析 
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不 同 项 目的 方式 来 把 基 个 因素 的 影响 提取 出 来 的 做 法 是 不 可 取 的 , 因为 项 目 与 项 目 之 间 在 很 多 方 
面 上 都 不 同 。 结 有 果 的 差别 有 可 能 是 所 研究 的 因素 造成 的 , 也 有 可 能 是 因为 外 部 的 、 没 有 观察 到 的 
因素 造成 的 ， 比 如 团队 经 验 、 软 件 的 领域 或 者 使 用 的 工具 等 。 在 微软 的 Windows 部 门 ， 有 一 个 统 
一 的 流程 ,部门 上 下 都 是 用 这 大 ,流程 和 相应 的 工具 ， 而 做 决定 的 方式 也 大 同 小 异 。 微 软 其 至 付出 
了 很 大 的 努力 来 保证 不 同 国家 的 开发 工作 也 能 遵循 一 个 统一 而 集中 的 流程 。Windows 开 发 环境 的 
统一 性 降低 了 对 这 个 研究 的 内 部 有 效 性 的 质疑 ， 并 让 我 们 更 确信 ，Nagappan、Murphy 和 Basili 三 
人 观察 到 的 组 织 复杂 度 和 发 布 后 缺陷 之 间 的 关系 并 不 是 由 于 二 进 制 文件 之 间 的 不 同 所 导致 的 偏 
差 造成 的 。 

而 且 ， 这 个 研究 的 规模 很 大 ， 包括 上 千 个 开发 人 员 和 二 进 制 文件 ， 以 及 数 百 万 行 源 代码 。 由 
于 Brooks 观 察 到 的 协调 和 沟通 会 有 超 线性 增长 的 情况 , 我 们 认为 协调 失灵 的 影响 在 较 大 型 的 软件 
项 目 中 会 更 大 一 些 。Windows Vista 很 明显 是 我 们 当今 使 用 的 软件 中 届 指 可 数 的 大 项 目 , 无 论 是 从 
开发 人 员 数 量 还 是 代码 的 量 级 。 所 以 说 ， 有 理由 认为 ， 小 一 些 的 (至 少 在 开发 人 员 数 量 上 少 一 些 
的 ) 项 目 ， 并 不 会 在 组 织 复杂 度 上 受到 如 此 大 的 影响 。 这 些 研 究 人 员 们 用 更 小 的 数据 集 来 重复 了 
他 们 的 实验 ， 以便 确定 在 何 种 规模 下 ,组 织 复杂 度 可 以 算 作 好 的 错误 预报 机 制 。 他 们 发 现 ， 在 30 
人 的 开发 团队 和 3 层 管 理 层 的 项 目 中 ,仍然 可 以 观察 到 复杂 度 指 标的 效果 。 

在 阅读 了 人 研究 原文 之 后 我 们 发 现 , 作者 们 对 于 细 市 非常 严谨， 并 对 量化 研究 中 可 能 出 现 的 问 
题 有 深刻 的 认识 (比如 研究 人 员 们 使 用 了 主 成 分 分 析 来 降低 复杂 度 质变 之 间 的 多 重 共 线 性 对 结果 
的 影响 )， 对 于 研究 结果 有 非常 全 面 的 分 析 。 这 个 假说 现在 既 有 了 理论 支持 ( 康 威 定律 、Brooks 
定律 等 ) 又 有 了 实证 证 据 。 此 外 ， 在 和 那些 有 着 软件 项 目 管理 经 验 的 人 进行 讨论 之 后 ， 他 们 表示 
这 些 结果 和 他 们 的 直 宽 及 经 验 相符 。 由 于 各 种 实验 和 人 研究 都 未 能 反 驶 我 们 的 结论 ， 作 为 科学 家 ， 
我 们 对 这 些 理论 的 信心 与 日 俱 增 ,。 如 果 能 在 更 多 不 同 背 景 的 项 目 中 重复 这 个 研究 是 十 分 有 益 的 ， 
因为 这 样 我 们 就 能 知道 这 些 结果 是 否 普 遍 使 用 , 或 是 只 适用 于 Windows Vista, 还 是 只 适用 于 某 一 
种 类 的 项 目 。 最后， 实践 者 必须 同时 考虑 这 些 研 究 的 背景 和 结果 ， 并 对 这 些 研 究 结 果 是 否 符合 
己 的 实际 情况 做 出 明智 的 判断 。 


11.4 FARR SpE) Ae 


前 两 个 研究 着 眼 于 商业 软件 。 而 最 近 二 十 年 间 ， 一 种 新 型 的 开发 模式 逐渐 浮 出 水 面 。 这 种 我 
们 称 之 为 自由 或 者 开源 的 软件 开发 主要 是 通过 互联 网 进行 ， 从事 开发 的 各 方 从 未 谋面 , 也 通常 不 
存在 共同 的 经 济 利益 。 这 和 “传统 ”的 开发 有 很 多 不 同 。 虽然 开发 人 员 的 雇主 会 付 钱 给 他 们 来 对 
这 些 开源 项 目 进行 开发 ,开源 项 目 本 身 很 少 直 接 付 钱 给 开发 人 员 。 也 就 是 说 ,大 多 数 人 可 以 来 来 
去 去 ， 随心所欲。 而 且 由 于 不 存在 一 个 “经 营 ”项 目的 公司 ， 组 织 结构 也 比较 松散 。 

Eric Raymond 所 写 的 一 系列 论文 让 他 成 为 开源 运动 的 代言 人 。 他 认为 ， 这 种 类 型 的 开发 可 以 
被 视 为 是 一 个 临时 的 集 市 ， 开 发 人 员 们 随意 地 在 代码 库 周围 来 来 去 去 , 随意 和 他 人 交谈 ,并 做 任 
何 他 们 愿意 的 工作 。 与 此 相对 ， 他 描述 了 一 套 可 控制 而 有 计划 的 商业 环境 下 的 开发 流程 ， 称 之 为 
教堂 模式 ， 即 每 个 人 都 被 分 配 到 清楚 规划 好 的 任务 ， 而 所 有 的 任务 都 已 预先 安排 好 。 当 然 ， 这 种 
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比较 极 痪 的 非 此 即 彼 的 分 类 稍微 有 些 仿 张 。 即 便 征 把 开源 软件 的 开发 和 商业 软件 的 开发 视 为 两 种 
完全 不 同 的 方式 也 不 宛 全 准确 。 

RECZE, BARFE H E A GIRARE, 但 是 开源 软件 呢 ? Brooks 定 律 能 够 成 
并 的 原因 之 一 就 是 因为 大 型 团队 的 额外 沟通 成 本 。 如 末 开 源 软件 项 目 真 是 一 个 没有 结构 的 集 市 ， 
那么 它 又 如 何 来 处 理 随 着 项 目的 规模 变 大 而 至 超 线性 增长 的 沟通 渠道 问题 呢 ? 我 们 决定 对 一 些 
兰 名 的 开源 项 目的 社会 结构 进行 研究 ， 看 看 它们 征 不 是 真 的 像 一 个 集 市 一 样 ， 此 外 ,我 们 还 将 看 
看 这 些 项 目的 组 织 结构 和 软件 架构 之 间 的 关系 。 

和 商业 公司 不 同 , 开源 项 目 第 党 没有 明确 定义 的 官方 组 织 结构 。 为 了 找 出 这 些 开源 项 目的 社 
会 结构 ， 我 们 搜集 了 开发 人 员 邮 件 列 表 的 历史 档案 。 这 些 档案 包括 了 各 种 讨论 ， 比 如 各 种 决议 、 
修正 、 政 策 以 及 所 有 运营 开源 项 目 所 必须 的 沟通 。 基 些 开 源 项 目 还 使 用 有 下 C， 但 是 我 们 所 选择 的 
项 目 要 求 所 有 重要 的 讨论 必须 通过 邮件 列表 进行 。 这 些 讨论 的 参与 者 包括 项 目的 开发 人 员 《〈 即 可 
以 对 源 代码 储存 库 进 行 写 操作 的 人 人 提交 补丁 的 贡献 者 以 及 其 他 一 些 只 是 想 参与 讨论 功能 、bug 
之 类 的 人 。 这些 项 目 中 大 部 分 的 活跃 参与 者 们 都 使 用 多 个 邮件 地 址 , 而 我 们 希望 能 够 把 这 些 邮 件 
地 址 都 对 应 到 实际 的 人 身上 。 为 了 解决 这 个 问题 , 我 们 使 用 了 启发 式 检测 和 人 人工 检 测 来 判断 电子 
邮件 的 地 址 。 此 外 ,我 们 还 把 邮件 地 址 对 应 到 了 源 代码 储存 库 的 账号 。 我 们 用 分 析 邮 件 列表 的 互 
动 并 生成 社交 网 络 的 方式 来 重 构 项 目的 社会 组 织 结构 。 举 例 来 说 ,如 末 张 三 发 表 了 一 条 消息 到 邮 
件 列表 ,而 村 四 阅 读 之 后 发 表 了 回复 ,那么 张 三 和 李 四 之 间 就 有 了 信息 流动 ， 也 就 可 能 会 产生 合 
作 。 因 此 , 我 们 可 以 根据 这 些 互动 信息 来 创建 社会 组 织 网 络 。 我 们 用 每 对 参与 者 之 间 的 互动 数量 
来 作为 连接 他 们 的 边 的 权重 。 

我 们 分 析 了 Perl、Python、Apache 服 务 戎 、PostgreSQL 数 据 库 以 及 Ant Java 编 译 系统 。 这 些 邮 
件 列 表 的 参与 者 数量 从 Python 的 1329 到 Per 的 3621 不 等 ， 实 际 的 项 目 开发 者 数量 从 Perlhy25 人 到 
Python 的 92 人 不 等 。 表 11-2 展 示 的 是 我 们 所 研究 的 项 目的 统计 数据 。 


411-2 开源 项 目 统计 
































”项 目 Apache Ant Pyhon Perl PostgresQL 
开始 日 期 1995-02-27 2000-01-12 1999-04-21 1999-03-01 1998-01-03 
结束 日 期 2005-07-13 2006-08-31 2006-07-27 2007-06-20 2007-03-01 
邮件 数量 101250 73157 66541 112514 132698 
邮件 列表 参与 者 2017 1960 1329 3621 3607 
开发 人 员 57 40 92 25 29 


我 们 使 用 这 些 社会 网 络 以 及 开发 人 员 的 修改 提交 活动 数据 来 回答 两 个 重要 的 回 题 。 

D 这 些 参与 者 是 合 会 按 是 我 们 所 发 现 的 社会 网 络 目 然而 然 地 形成 团队 ? 

O 软件 的 技术 结构 和 参与 者 的 团队 结构 之 间 有 什么 关系 ? 

要 回答 第 一 个 同 题 , 就 需要 涉及 复杂 网 络 分 析 的 领域 。 这 个 领域 中 的 主要 研究 课题 之 一 古 探 
济 群 落 结构 ， 即 探测 某 个 网 络 中 存在 着 的 相互 紧密 连接 的 子 网 络 。 群落 结构 检测 技术 尝试 把 一 个 
网 络 分 成 一 组 一 组 的 市 尽 ， 这 些 组 内 部 的 广 点 联系 非常 密集 ， 而 组 之 间 的 联系 则 很 稀 松 。 群落 结 
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构 的 程度 则 可 以 被 量化 为 一 个 指标 ， 即 模块 度 。 模 块 度 的 范围 从 0 到 1，0 代 表 完 全 随机 的 网 络 ，1 
代表 网 络 是 由 多 个 互 不 相关 的 派系 组 成 .此 前 已 有 人 研究 发 现 ,自然 产生 的 具有 清晰 分 组 的 网 络 ( 即 
模块 化 的 网 络 ) 的 模块 度 在 0.3 到 0.7 之 间 。 

图 11-2 的 盒 状 图 简单 地 展示 了 这 些 项 目 在 三 个 月 内 的 模块 度 。 大 部 分 的 模块 度 都 远 超 0.3 的 国 
E, 这 意味 着 强烈 的 群落 结构 。 更 具体 一 点 说 ,虽然 这 些 网 络 太 大 太 复 杂 以 至 于 我 们 无 法 人 简单 地 
将 其 用 图 表 来 表示 , 但 十 我 们 可 以 看 出 沟通 网 络 是 模块 化 的 ， 有 消 晰 的 开发 人 员 分 组 , 组 内 的 开 
发 人 员 相 互 之 间 沟 通 比 起 组 间 的 沟通 要 多 得 多 。 这些 证 据 表 明 开 源 项 目 并 不 是 无 组 织 无 纪律 的 开 
发 人 员 组 成 的 ， 他 们 之 间 也 并 不 是 盲目 混乱 地 相互 沟通 。 在 开发 人 员 自 愿 的 情况 下 ,似乎 (至少 
对 这 些 项 目 来 说 ) 开源 项 目 实际 上 也 是 由 有 组 织 、 有 结构 的 开发 团队 完成 的 。 商 业 软 件 团队 和 这 
些 团队 的 关键 区 别 是 开源 软件 的 团队 是 目 然 形成 的 ， 而 不 古 由 管理 层 决 定 。 此 外 ， 我 们 还 发 现 
这 些 团 队 的 组 成 要 比 商 业 团 队 更 加 动态 ， 团 队 生 命 期 很 少 超过 六 个 月 ， 并 党 第 以 各 种 不 同 的 方 
式 重组 。 














Ant Apache Perl PostgreSQL Python 
项 目 


图 11-2 RAE GMH) 


仅仅 只 是 证 明 在 沟通 网 络 中 存在 一 个 个 的 分 组 还 不 能 说 我 们 验证 了 康 威 定律 或 者 我 们 的 推 
论 。 我 们 还 需要 研究 这 些 相互 存在 沟通 的 分 组 之 同 的 关系 以 及 他 们 共同 进行 的 技术 任务 。 这 个 社 
会 结构 和 软件 结构 是否 有 联系 ?要 回答 这 个 问题 ,我 们 研究 了 团队 的 各 种 开发 铂 动 , 具体 就 是 每 
个 团队 的 开发 人 员 所 涉及 的 文件 、 国 数 及 类 。 基 于 对 这 些 信息 的 分 析 ， 我 们 观 守 到 两 点 。 

首先 ,相互 交流 的 开发 人 员 所 负责 的 系统 部 分 通 贡 是 相互 关联 的 。 如 采 我 们 的 群落 检测 算法 
把 两 个 开发 人 员 分 到 同一 个 团队 , 那么 他 们 就 非常 有 可 能 正在 修改 同样 的 一 些 文件 或 者 函数 。 此 
外 ,在 同一 个 团队 的 成 员 之 则 的 邮件 沟通 中 也 第 弟 会 提 到 上 面 的 那些 函数 和 文件 。 也 就 是 说 ， 沟 
通 模 式 正好 反应 了 开发 人 员 之 间 的 合作 开发 行为 。 
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兴趣 可 以 在 完整 版 论文 中 找到 更 深入 的 分 析 。 

在 Apache Web 服 务 强 项 目 中 ,从 2003 年 的 5 月 到 7 月 ,有 这 样 一 个 团队 ,组 员 包 括 Rowe、 Thorpe 
(这 两 个 是 开发 人 员 ) 以 及 Deaves、Adkins 和 Chandran。 他们 讨论 了 一 些 和 mod ssl 和 Apache 的 SSL 
接口 相关 的 bug 的 修正 问题 。 讨 论 的 话题 包括 错误 的 输入 /输出 代码 、 模 块 加 载 /释放 /初始 化 以 及 
mod_ssl 和 服务 绒 的 整合 癌 题 。 几 乎 所 有 的 讨论 都 是 关于 SSL 的 代码 , 而 且 在 这 个 时 间 段 之 内 这 个 
小 组 内 的 成 员 所 修改 的 文件 几乎 部 古 在 modules/ssl 目 录 之 下 ， 如 下 所 示 。 

modules/arch/win32/mod isapi.h 

modules/ssl/mod_ssl.c 

modules/ssl/mod_ssI.h 

modules/ssl/ssl_engine_config.c 

modules/ssl/ssl_engine_init.c 

modules/ssl/ssl_engine_io.c 

modules/ssl/ssl_engine_kernel.c 

modules/ssl/ssl_engine_pphrase.c 

modules/ssl/ssl_toolkit_compat.h 

modules/ssl/ssl_util.c 

modules/ssl/ssl_util_ssl.c 

modules/ssl/ssl_util_ssl.h 

support/ab.c 

FA PFA, 20012410H 12H PostgreSQLIn BHA AY—“F ABA Ade 4T Se FCI AI 
入 式 SQL 的 工作 ， 男 一 个 团队 则 完全 只 关注 于 更 新 SGML 文 档 源 。 在 后 来 的 一 段 时 间 中 ， 一 个 新 
产生 的 小 组 的 活动 和 讨论 全 部 关于 开发 和 测试 PostgreSQL 的 JDBC 驱 动 程序 (他们 修改 的 源 代码 
和 闹 试 代码 都 处 在 JDBC 鸭 子 目 录 下 )， 而 男 一 个 小 很 多 的 小 组 则 关注 了 Unicode 的 支持 。 

此 外 我 们 还 发 现 了 很 多 类 似 的 例 了 于， 这 些 例子 都 是 项 目的 参与 者 们 根据 菏 些 任务 分 成 小 组 ， 
而 这 些 任务 则 是 直接 对 应 到 代码 库 的 某 个 部 分 。 关 于 如 何 解决 问题 的 讨论 、 任 务 的 分 配 、 决 策 的 
制定 的 沟通 正好 可 以 对 应 正在 进行 的 实际 开发 工作 , 有 时 候 其 至 可 以 直接 对 应 到 生成 的 补丁 的 结 
构 。 显 然 ， 对 于 这 些 项 目 来 说 康 威 推论 是 成 立 的 。 

那么 , 这 些 研 究 结 来 的 意义 在 哪 ? 首先 , 这 表明 软件 结构 和 社会 结构 之 则 的 强烈 关联 和 开发 
流程 无 天 ， 如 琳 钵 循 了 这 些 关 联 ， 开 源 的 软件 项 目 也 能 够 做 得 很 好 。 其 次 ， 我们 了 解 到 开源 软件 
处 理 扩展 性 和 工作 分 配 问题 的 方式 和 传统 的 开发 模式 类 似 。 少 数 开发 人 员 (就 我 们 观察 到 的 来 看 
平均 是 3 到 7 个 人 ) 会 组 成 小 组 ， 共 同 完 成 软件 中 的 一 小 部 分 的 相关 任务 。 我 们 的 研究 结果 支持 了 
一 种 常见 的 说 车 (虽然 仍然 还 有 和 争议 )， 即 成 功 的 开源 软件 项 目 具 备 自我 调整 和 自我 优化 的 功能 ， 
而 这 种 说 法 符合 康 威 推论 。 此 外 ， 虽 然 兽 有 人 认为 开源 软件 项 目 可 以 在 某 种 程度 上 避免 Brooks 
定律 和 康 威 定律 的 影响 ， 但 是 研究 显示 这 些 项 目 似 乎 还 是 会 受到 两 者 的 影响 。 
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11.5 ”总结 





总 的 来 说 , 这 些 研 究 告 诉 了 我 们 什么 , 而 我 们 又 应 该 如 何 利 用 这 些 研 究 结 来 来 改 矢 现 在 的 软 
件 开 发 实践 呢 ? 

这 些 研 究 都 证 明 ， 当 软件 项 目 中 的 开发 人 员 的 组 织 结构 和 软件 的 系统 结构 类 似 的 时 候 , 项 目 
会 比 两 者 不 同 的 时 候 做 得 更 好 。 我 们 在 做 决策 的 时 修 ， 应 该 把 两 种 结构 都 考虑 进来 ,特别 是 在 初 
期 设计 和 规划 的 阶段 , 当 经 济 上 允许 的 时 候 , 我 们 应 该 尽量 把 项 目 结构 和 软件 结构 密切 对 应 起 来 。 
甚至 在 项 目 结构 已 经 定 下 来 的 时 候 ， 也 应 该 重新 安排 结构 ， 已 保证 二 者 的 密切 联系 。 

康 威 推论 可 以 为 开发 珊 来 负面 的 影响 也 可 以 市 来 正面 的 影响 , 而 且 如 采 项 目 负责 人 能 够 善 用 
它 ， 束 可 以 把 项 目 做 得 更 好 。 现 在 , 证据 已 经 被 提出 ， 如 霖 还 要 忽略 它 有 的话， 就 要 目 己 承担 风险 
了 。 当 然 ， 你 还 需要 目 己 独立 的 判断 。 如 琳 软 件 项 目 中 只 有 5 个 开发 人 员 ， 那 么 就 算 违 反 康 威 推 
WIEME HEPS RKK. 在 软件 开发 全 球 化 的 时 代 , 我 们 可 能 很 难 纯粹 为 了 迁就 这 个 推论 而 让 
开发 人 员 搬 迁 。 尽 省 如 此 ,我 们 还 是 相信 ,在 所 有 背景 邦 相 同 的 情况 下 ， 如 来 我 们 能 更 努力 和 主 
动 地 去 将 软件 项 目的 社会 结构 和 技术 结构 对 应 起 来 ， 结 采 仍 然 会 比 不 去 做 要 好 很 多 。 

随 着 软件 团队 不 断 地 增 大 , 对 于 合作 和 协调 的 深入 了 解 也 将 为 我 们 市 来 越 来 越 大 的 价值 。 我 
们 鼓励 那些 在 自己 映 上 观察 到 了 上 康 威 推论 的 正面 或 者 负面 影响 (或 者 寻找 了 影响 但 是 没 找到 ) 的 
软件 项 目 和 团队 能 够 分 享 他 们 的 经 验 , 并 让 我 们 对 社会 和 技术 结构 之 间 的 互动 有 更 多 的 了 解 。 只 
有 人 们 都 来 分 享 证 据 或 者 反 证 ， 我 们 才能 继续 理解 和 改善 我 们 的 理论 。 
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测试 并 动 开发 的 效 朱 如 何 
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在 软件 行业 中 ， 测 试 驱 动 开 发 (TDD) “是 最 常 被 谈 到 ， 却 又 最 少 被 用 到 的 敏捷 实践 之 一 。 
它 被 忽视 的 主要 原因 是 我 们 不 理解 它 对 人 、 流 程 、 产 品 的 作用 。 虽 然 大 部 分 人 认同 在 编码 之 前 写 
测试 能 促进 更 稳健 的 代码 实现 和 更 好 的 设计 , 与 TDD 效 果 相 关 的 未 知 成 本 , 以 及 对 程序 员 最 第 用 
的 “ 先 编码 再 测试 ”模式 的 倒置 ， 阻 止 了 TDD 的 广泛 使 用 。 

为 了 提供 当前 TDD 效 果 的 证 据 总 览 ,我 们 开展 了 一 次 对 在 线 数据 库 和 科学 出 版 物 中 TDD 研 究 
的 系统 性 评审 。 系统 性 评审 是 一 种 在 医疗 领域 中 非常 普及 的 研究 方法 ， 用 来 汇集 并 分 析 临 床 试验 
的 数据 结 有 末 。 系 统 性 评审 旨 在 回答 普遍 性 问题 :“ 发 表 的 证 据 如 何 证 明 使 用 技术 X 的 作用 ? ”在 
医学 中 ,系统 性 评审 在 评估 药品 效果 和 对 疾病 的 替代 疗法 中 扮演 着 关键 的 角色 。 实 证 软件 工程 研 
究 员 们 也 采用 了 这 种 方法 来 总 结 和 分 析 各 种 软件 开发 实践 的 效果 的 证 据 。 这 一 话题 已 经 在 第 三 草 
中 有 所 描述 ，Barbara Kitchenham 著 。 另 外 ， 在 她 ”和 Dybi 等 人 “的 报告 中 也 有 所 谈 及 。 

在 这 晶 中 ,我们 不 会 提供 正式 的 系统 性 评审 报告 ， 而 会 把 IDD 想 象 成 一 种 药丸 ， 从 药理 性 的 
角度 来 描述 它 的 疗效 。 我 们 希望 读者 把 这 章 剩 余 的 人 章节 想象 成 TDD“ 药 丸 ”的 医疗 报告 ， 并 带 着 
以 下 问题 继续 阅读 : 

“如 果 TDD 是 一 颗 药 九 ， 你 会 服用 它 来 提高 你 的 健康 指数 吗 ?” 


12.1 TDD 药丸 是 什么 


以 下 列 出 的 是 IDD 药 丸 的 配方 ， 必 须 “ 严 格 ” 按 照顾 序 一 步 一 步 执行 : 
(1) 选择 一 项 小 任务 ， 

(2) 为 这 项 任务 写 一 个 测试 ， 

(3) 运行 所 有 测试 来 验证 新 的 测试 失败 ， 
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(4) 写 出 最 少 的 生产 代码 来 完成 任务 ， 

(5) 运行 所 有 测试 (包括 新 的 测试 ) 来 验证 它们 通过 ， 

(6) 按照 需要 重 构 代码 ， 

(7) 从 第 (了 有 ) 步 开始 重复 。 

TDD 药 丸 中 起 主要 作用 的 成 分 是 在 产生 代码 前 创造 测试 用 例 。 在 写 代 码 前 创造 测试 用 例 需 
要 有 足够 的 耐心 来 考虑 设计 解决 方案 : TEAC. PRBS AT EAT VA Be BY HE Be AE Se i 
况 。 在 产生 代码 之 前 运行 新 写 的 测试 用 例 能 帮助 验证 新 写 的 测试 用 例 古 否 正 确 (如 采 测 试用 例 
此 时 已 经 通过 ， 那 就 意味 着 没 达 到 期 望 的 测试 效 末 )， 而且 系统 是 可 以 正 第 编译 的 。TDD 药 丸 也 
包括 只 编写 恰到好处 刚好 能 使 测试 用 例 通 过 的 生产 代码 ， 以 便 促 进 整 洁 的 模块 化 设计 。 男 外 ， 
TDD 使 用 者 创造 了 一 个 不 断 增 长 的 目 动 化 测试 用 例 库 ， 一 旦 现 有 系统 发 生 了 改动 ， 可 以 随时 运 
行 所 有 的 测试 库 来 验证 改动 的 正确 性 。 

正如 其 他 许多 药物 一 样 ，IDD 药 丸 也 有 一 些 官方 的 变种 ， 包 括 AIDD (验收 测试 驱动 开发 )、 
BDD (行为 驱动 开发 ) 和 STDD (故事 测试 驱动 开发 )。AIDD 把 一 步 步 的 “小 任务 ”和 蔡 代 为 “ 功 
能 层面 的 业务 逻辑 任务 ， 而 BDD 则 使 用 “行为 规 攻 。IDD 中 任务 的 顺序 使 之 区 别 于 其 他 治疗 方 
法 ， 但 是 TDD 和 药丸 的 官方 变种 也 会 包含 一 些 其 他 配方 ， 如 将 任务 拆 蛇 为 倍 、 重 构 、 保 持 测 试 - 编 
码 的 短 人 循环 、 以 及 持续 不 断 的 回归 测试 。 








警告 除了 重 构 之 外 ， 由 于 实践 中 的 不 同 解读 和 主要 成 分 的 支配 性 ， 一 些 关键 配方 可 能 不 存在 
于 许多 “通用 的 TDD 药丸 中 ， 


12.2 TDD 临床 试验 概要 


我 们 回顾 的 重点 是 收集 TDD 药 丸 对 代码 内 部 质量 〈 参 照 下 面 的 “度量 代码 质量 )、 外 部 质 
量 、 生 产 力 和 测试 质量 所 产生 效 末 的 定量 的 证 据 。 对 TDD 药 丸 的 评 佑 基于 从 32 项 临床 试 难 中 收 
集 的 数据 。 在 2009 年 的 第 一 季度 , 作者 从 在 线 综合 指数 、 主 流 科技 出 版 物 (ACM、IEEE、Elsevier) 
和 “灰色 文献 ”( 技 术 报告 、 论 文 ) 中 收集 了 325 项 TDD 研 究 的 报告 。 然 后 ， 这 325 项 报告 通过 两 
级 科 选 程序 被 缩减 为 22 项 。4 位 研究 者 过 滤 挤 了 2000 年 之 前 开展 的 研究 、IDD 药 丸 的 定性 研究 ， 
以 及 问卷 调查 和 完全 主观 的 分 析 。 这 些 报告 中 有 些 包含 多 项 或 重合 的 试验 (也 就 是 说 ， 同 样 的 
试验 出 现在 不 同 的 文革 中 )。 在 这 种 情况 下 ,试验 仅 被 计算 一 次 。 之 后 ， 由 5 位 研究 者 组 成 的 团 
队 从 报告 中 抽取 了 关于 人 研究 设计 、 人 研究 背景 、 参 与 者 、 洽 闻 方 法 及 效 坟 对照， 以 及 人 研究 结 来 的 
关键 信息 。 人 研究 团队 总 共 分 析 了 2 篇 报告 ，32 项 独立 试验 。 





度量 代码 质量 
系统 的 “内 部 质量 ”与 它 的 设计 质量 有 关 。 通 常 的 理解 是 ， 好 的 设计 意味 着 简单 、 
模块 化 、 易 于 维护 和 易于 理解 。 虽 然 TDD 主 要 被 理解 为 开发 实践 ， 它 也 被 认为 是 设计 实 
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践 。 当 使 用 TDD 药 丸 时 , 我们 期 待 出 现 增 量 式 的 简单 设计 。 简 单 设 计 是 由 下 列 实践 驱动 
的 : 第 一 , 模块 化 ， 它 使 代码 可 测 ; 第 二 ， 写 最 少 的 生产 代码 来 完成 简单 的 任务 ; FH, 
持续 重 构 。TDD 试 验 用 以 下 的 一 种 或 多 种 方法 来 评估 系统 的 内 部 质量 : 

口 面向 对 象 的 指标 。 这 涉及 每 类 加 权 方 法 数 (WMC? ) 、 继 承 树 的 深度 (DIT”)， 等 等 ; 

O BAR; 

O 代码 密度 〈 如 ， 每 个 方法 的 代码 行 数 ) ; 

口 每 个 功能 的 代码 量 。 

系统 的 “外 部 质量 ”通常 由 发 布 前 或 者 发 布 后 的 缺陷 数量 来 度量 。TDD 被 认为 可 以 
提高 外 部 质量 , 因为 它 鼓 励 开 发 人 员 多 写 测 试用 例 , 这 点 对 于 简单 任务 的 开发 人 员 很 容 
DER, 系统 被 不 断 地 回归 测试 , 而 由 改变 引起 的 错误 能 很 容易 地 被 细 粒 度 的 测试 检测 
到 。 在 TDD 的 试验 中 ， 我 们 用 以 下 一 种 或 多 种 指标 来 汇报 外 部 质量 : 

口 通过 的 测试 用 倒数 ; 

口 缺陷 数目 ; 

O 缺陷 密度 ; 

O 每 个 测试 的 缺陷 数 ; 

口 修改 的 陷 的 工作 量 ; 

口 变更 的 密度 ; 

O 预防 性 变更 的 比例 。 


32 项 试验 以 对 比 实验 、 试 点 研究 或 商业 项 目的 方式 在 学 术 界 或 产业 界 中 展开 。 对 比 实验 在 学 
术 实 验 室 或 者 可 探 产业 环境 中 通过 定义 好 的 研究 协议 展开 ; 试点 研究 使 用 不 那么 结构 化 的 实验 任 
务 执行 ; 商业 项 目 局 用 把 TDD 作 为 每 日 工作 一 部 分 的 行业 团队 。 这 些 试验 的 参与 者 有 不 同 的 经 验 
等 级 ， 从 大 学 生 到 研究 生 到 专业 人 员 。 每 项 试 骤 参与 者 的 人 数 从 1 个 人 到 132 个 人 不 等 。 化 在 试验 
上 的 工作 量 也 有 很 大 的 跨度 ， 从 几 个 人 小 时 到 21 600 人 小 时 。 每 个 试验 都 比较 了 TDD 药 丸 与 其 他 
治疗 方法 (通常 是 传统 的 最 后 测试 的 开发 方法 ) 相 比 的 效果 。 参与 群体 的 对 象 也 由 不 同 单元 组 成 ， 
如 个 人 人、 结对、 团队 和 项 目 。 

基于 参与 者 的 经 验 、 实 验 结构 的 细 方 、 试 验 的 光 围 ， 我 们 把 32 个 试验 分 为 4 个 级 别 。 参 与 者 
的 经 难 由 他 们 起 否 是 本 科 生 、 研 究 生 或 专业 人 员 决 定 。 

基于 对 TDD 的 使 用 过 程 和 对 比 疗法 的 接 述 , 我 们 将 试验 的 构建 评估 为 好 , 一 般 , 差 或 者 未 知 。 
好 的 构建 执行 所 有 TDD 处 方 中 的 成 分 ， "一般 ”的 构建 规定 了 先 写 测试 但 未 包含 所 有 的 TDD 
成 分 ， 差 。” 的 构建 没有 执行 IDD 的 步骤 ， 未 知 ”的 构建 设 有 说明 TDD 步 又 是 合 执行 。 

最 后 ， 基 于 参与 时 间 和 参与 人 数 所 得 出 的 汇报 工作 量 或 预 佑 的 工作 量 , 我 们 把 试验 的 规模 记 
孙 为 小 、 中、 大 。 小 项 目 涉及 少 于 170 人 小 时 的 总 工作 量 ， 而 大 项 目的 芝 围 从 3000 人 小 时 到 21600 

















D Weighted Methods Per Class; 每 个 类 所 定义 的 方法 的 个 数 ， 度 量 一 个 类 中 所 定义 方法 的 复杂 性 。 一 一 译 者 注 
© Depth of Inheritance Tree; 对 根 类 的 最 大 继承 路 径 。 一 一 译 者 注 
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人 小 时 不 等 。 我 们 使 用 了 一 个 简单 的 类 聚 算法 把 项 目的 规模 分 类 ， 而 参与 者 的 经 验 和 构建 的 细 下 
则 基于 试点 报告 中 发 现 的 接 述 性 数据 。 

随 着 试验 级 别 的 提升 ， 我们 也 对 使 用 TDD 药 丸 在 “现实 生活 ”中 的 效 雪 更 有 信心 。 最 低 的 级 
别 是 L0， 只 包含 所 有 的 小 规模 试验 。 这 些 试验 只 汇报 了 小 于 170 人 小 时 的 工作 量 或 少 于 11 个 参与 
者 的 情况 。 下 一 个 级 别 是 Ll1, 包含 中 等 或 大 规模 的 试验 , 但 是 实施 的 构建 被 评 为 “ 差 " 或 未 知 。 
L2 级 别 包含 了 被 评 为 “一 般 ”或 者 “好 "， 并 且 参 与 者 为 本 科 生 的 大 中 型 试验 项 目 。 最 高 的 级 别 
为 L3， 包 含 被 评 为 “一 般 ” 或 者 “好 ”， 并 且 参 与 者 为 研究 生 或 专业 人 员 的 大 中 型 试验 项 目 。 

表 12-1 总 结 了 我 们 对 试验 分 级 时 所 使 用 的 参数 。 表 12-2 展 示 了 每 个 级 别 中 试验 的 个 数 。 


表 12-1 临床 TDD 试 验 的 等 级 














LO L1 L2 L3 
经 验 任意 任意 本 科 生 研究 生 或 专业 人 员 
构建 任意 差 或 未 知 还 行 或 好 还 行 或 好 
规模 小 中 或 大 中 或 大 中 或 大 


表 12-2 ”临床 TDD 试 验 的 分 类 


类 J LO L1 L2 L3 总 Ñ 
对 比试 验 2 0 2 4 3 
试点 研究 2 0 5 7 14 
行业 应 用 1 7 0 2 10 
总 数 5 7 7 13 32 


12.3 TDD 的 效力 


我 们 分 析 了 TDD 试 验 中 TDD 药 丸 对 于 生产 力 、 内 部 和 外 部 质量 、 测 试 质量 效 末 的 定量 结 来。 
直接 比较 跨 试 验 的 定量 结 来 是 不 可 能 的 ， 因 为 不 同 的 试验 用 不 同 的 方法 度量 TDD 的 效力 。 所 以 ， 
我 们 对 每 个 试验 分 配 了 一 个 概要 值 :“ 更 好 "、“ 更 差 *、“ 混 合 ” 或 者 “无 法 确定 /没有 区 别 。 概 
要 值 由 IDD 药 丸 疗 效 的 定量 结 东 与 传统 对 照 组 的 比较 所 决定 。 概 要 值 也 包含 了 报告 的 作者 对 试验 
结 末 的 解释 。 在 概要 值 为 “更 好 ”的 试验 中 ， 大 多 数量 化 指标 证 实 TDD 药 丸 比 对 照 疗法 的 疗效 更 
好 。 在 概要 值 为 “更 差 ”的 试验 中 ,大 多 数量 化 指标 支持 对 照 疗 法 的 疗效 更 好 。 概 要 值 为 “无 法 
确定 /没有 区 别 ” 的 试验 没有 决定 性 的 结 末 ， 或 者 没有 观察 到 区 别 。 最 后 ， 概 要 值 为 “混合 ”的 
试 难 中 ,一 些 度量 文 持 TDD， 而 另 一 些 不 支持 。 所 有 这 些 概要 值 都 参考 了 研究 者 对 于 人 研究 结 有 的 
解读 ， 因 为 在 很 多 情况 下 ， 报 告 省 略 了 一 些 可 能 会 影响 客观 外 部 评 佑 的 细 区 。 

在 以 下 章节 中 ， 我 们 会 尽力 得 出 一 些 关 于 试验 中 IDD 价 值 的 结论 。 





12.3.1 内 部 质量 


试验 中 得 到 的 证 据 显 示 ，IDD 对 内 部 质量 效果 并 不 一 致 。 虽 然 TDD 在 一 些 指标 类 型 《复杂 度 
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和 重用 度 ) 中 似乎 相 比 对 照 实 验 组 产 出 了 更 好 的 结果 ， 但 是 在 其 他 指标 GRA AAR) ETDD 
的 表现 总 是 差强人意 。 另 一 个 从 试验 数据 中 观察 到 的 结束 表明 ，TDD 产 出 的 生产 代码 在 方法 /类 
的 级 别 更 简单， 但 是 在 包 / 项 目 级 别 更 复杂 。 这 种 不 一 致 的 效果 在 更 严格 〈《 即 L2 和 L3) 的 试验 中 
更 明显 。 内 部 质量 的 区 别 也 可 能 是 由 于 其 他 因素 造成 的 ， 如 积极 性 、 技 能 、 经 验 和 学 习 效 果 。 表 
12-3 基 于 内 部 质量 的 度量 对 试验 归 类 。 





注意 在 下 列表 格 中 ， 每 一 格 中 的 第 一 个 数字 汇报 了 所 有 试验 ， 而 括号 中 的 数字 仅 汇 报 L2 和 L3 


的 试验 。 
表 12-3 对 于 内 部 质量 的 效果 
类 别 更 好 更 差 = = 无 结果 或 无 区 别 总 8 
对 比试 验 1(0) 0(0) 0(0) 2(2) 3(2) 
试点 研究 1(1) 1(1) 3(]) 2(2) 7(5) 
行业 应 用 3(]) 1(1) 0(0) 0(0) 4(2) 
总 数 5(2) 2(2) 3(1) 4(4) 14(9) 


12.3.2 ”外 部 质量 


有 一 些 证 据 显 示 TDD 能 改善 外 部 质量 。 虽然 对 比试 验 的 结 末 儿 乎 都 古 非 结 论 性 的 , 但 行业 应 
用 和 试点 研究 都 强 烈 俩 加 于 IDD。 然 而 , 行业 应 用 和 对 比 实验 对 TDD 的 偏好 性 证 据 在 过 滤 挥 不 严 
格 的 研究 (LO 和 Ll 试验 ) 后 消失 了 。 另 外 ， 试 点 研究 和 对 比试 验 的 证 据 在 LO 和 Ll 被 过 滤 掉 之 后 
显示 出 和 矛盾。 然而 如 有 所 有 研究 都 同等 计数 的 话 , 证 据 会 显示 IDD 约 丸 能 改善 外 部 质量 。 表 12-4 
基于 外 部 质量 度量 对 试验 归 类 。 














表 12-4 ”对 于 外 部 质量 的 效果 


类 zl 更 好 更 差 i f 无 结果 或 无 区 别 总 A 

对 比试 验 1(0) 2(2) 0(0) 3(3) 6(5) 

试点 研究 6(5) 1(1) 0(0) 2(2) 9(8) 

行业 应 用 6(0) 0(0) 0(0) 1(1) 7(1) 

总 数 13(5) 3(3) 0(0) 6(6) 22(14) 
12.3.3 生产 力 


“生产 力 ”5| 发 了 关于 TDD 最 有 和 争议 话题 。 虽 然 许 多 人 承认 使 用 TDD 需 要 一 条 陡峭 的 学 习 曲 
线 ， 可 能 会 在 一 开始 降低 生产 力 ,然而 人 们 并 没有 对 长 期 效 采 的 共识 。 一 些 论点 预计 生产 力 会 随 
着 TDD 的 使 用 而 上 升 ， 原 因 包 括 更 容易 在 简单 的 任务 间 切 换 背 景 ， 提 高 的 外 部 质量 〈 更 少 的 错误 
以 及 错误 可 以 更 快 被 发 现 ), 提高 的 内 部 质量 (由 于 简单 设计 修改 代码 更 容易 ), 以 及 提高 的 测试 
质量 《由 于 自动 化 测试 ， 引 入 新 错误 的 机 会 很 小 )。 另 外 一 些 论点 争论 说 TDD 招 致 太 多 的 额外 开 
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销 ， 会 对 生产 力 产 生 人 负面 效应 ， 因 为 太 多 的 时 间 和 精力 被 花 在 写 测试 而 不 古 增加 新 功能 上 。 在 
TDD 试 验 中 所 使 用 的 评 佑 生产力 的 不 同 度 量 方 法 包括 : 开发 和 维护 成 本 、 随 时 间 产 出 的 代码 量 或 
者 功能 量 、 每 单元 工作 量 所 产 出 的 代码 量 或 功能 量 。 

试验 中 得 到 的 证 据 显 示 , IDD 对 生产 力 的 效 朱 并 不 一 致 。 对 比试 验 中 的 证 据 显 示 出 生产 力 随 
着 TDD 的 使 用 而 提升 。 然 而 试点 研究 提供 了 混合 证 据 ， 一 些 支 持 TDD,， 男 一 些 反 对 。 在 行业 研究 
中 ,证 据 显 示 TDD 使 生产 力 更 差 。 即 使 只 考虑 更 严格 的 研究 (L2 和 L3)， 证 据 也 被 分 为 支持 和 有 反 
对 在 生产 力 上 的 效果 。 表 12-5 基 于 生产 力 的 效果 对 试验 归 类 。 


表 12-5 ”对 于 生产 力 的 效果 








类 别 更 好 更 2 混 合 无 结果 或 无 区 别 总 R 
对 比试 验 3(1) 0(0) 0(0) 1(1) 4(2) 
试点 研究 6(5) 4(4) 0(0) 4(3) 14(12) 
行业 应 用 1(0) 3(1) 0(0) 1(0) 7(1) 
总 数 10(6) 9(5) 0(0) 6(4) 25(15) 


12.3.4 测试 质量 


由 于 在 IDD 中 测试 用 例 先 于 所 有 开发 行为 , 测试 一 个 不 断 发 展 的 系统 的 正确 性 应 该 在 成 长 中 
的 目 动 化 测试 的 帮助 下 更 容易 。 此 外 ， 由 于 细 粒 度 测 试 的 产 出 ,测试 过 程 应 该 是 高 质量 的 。 在 试 
验 中 ， 剖 试 质量 由 测试 密度 、 测 试 履 盖 率 、 测 试 生产 力 或 测试 工作 量 所 决定 。 

有 一 些 证 据 显 示 TDD 改 善 了 测试 质量 。 大 部 分 证 据 从 试点 研究 中 来 , BEELA S 
研究 之 后 也 显示 出 支持 TDD。 对比 实验 显示 TDD 至 少 和 对 照 疗 法 有 相同 的 进展 。 行业 应 用 中 的 证 
据 不 足 ， 无 法 做 出 结论 。 

因此 ，IDD 相 关 的 测试 质量 似乎 至 少 不 比 其 他 方法 差 ， 而 且 通 负 要 更 好 。 这 里 我 们 期 望 更 有 
力 的 结 东 : 既然 鼓励 测试 用 例 开 发 是 IDD 起 作用 的 成 分 中 最 主要 的 一 个 , 总 体 的 证 据 对 TDD 的 文 
持 应 该 在 这 些 人 研究 报告 的 测试 质量 度量 中 显现 出 来 。 

表 12-6 基 于 测试 质量 对 试验 归 类 。 


表 12-6 ”对 于 测试 质量 的 效果 




















类 别 更 好 更 差 混 Of 无 结果 或 无 区 别 总 A 
对 比试 验 2(1) 0(0) 0(0) 3(3) 5(4) 
试点 研究 1(5) 1(1) 0(0) 1(1) 9(7) 
行业 应 用 1(0) 1(1) 0(0) 1(0) 3(1) 

总 数 10(6) 2(2) 0(0) 5(4) 17(12) 


12.4 在 试验 中 强制 TDD 的 正确 剂量 
虽然 大 部 分 试验 并 没有 控制 TDD 药 丸 的 服用 量 (在 软件 说 法 中 被 翻译 为 缺乏 对 过 程 一 致 性 的 
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注意 )， 我 们 相信 不 同 的 试验 和 不 同 的 对 象 所 使 用 的 剂量 站 不 同 的 。 “AE” 和 “未 知 ” 构 建 的 试验 
可 能 没有 严格 执行 TDD 的 使 用 方法 , 我们 也 相信 很 可 能 试验 参与 者 选择 一 些 成 分 定制 了 药丸 而 不 
契 严 格 齐 循 TDD 的 教科 书 定义 。 这 个 问题 对 得 出 普 过 结论 产生 了 威胁 。 在 医学 环境 中 ,不 强制 执 
行 或 度量 TDD 的 使 用 类 似 于 没有 保证 病人 在 治疗 中 服 拘 ， 或 者 不 知道 病人 服用 的 剂量 。 因 而 ,所 
观 峙 到 的 IDD 药 丸 的 效果 可 能 归 和 谷 于 流程 的 不 一 致 性 或 者 其 他 一 些 役 有 被 足够 撒 述 和 控制 的 因 
素 。 在 将 来 的 试验 中 ， 治 疗 方法 的 一 致 性 和 对 照 组 应 该 受到 仔细 的 监控 。 

不 管 TDD 试 验 的 汇报 质量 如 何 ， 有 人 会 提出 一 个 相关 的 问题 “在 现实 生活 中 需要 体 循 TDD 
的 书本 定义 吗 ? “有 时 候 在 为 特定 工作 背景 和 个 人 风格 做 出 调整 后 , 病人 服用 半 颗 或 四 分 之 一 颗 
药丸 就 会 有 起 色 。 有 微观 层面 的 开发 日 志 工具 可 用 于 调查 这 些 问题 。 这 些 日 志 工具 可 以 帮助 控制 
TDD 流 程 的 一 臻 性， 并 帮助 理解 TDD 在 现实 生活 中 的 实践 执行 方式 。 


125 ”警告 和 副作用 


在 这 一 证 中 ， 我 们 将 提出 几 个 关于 IDD 药丸 的 问题 ， 可 能 可 以 调和 TDD 在 不 同 环境 下 的 
效力 。 

*HUUUUUUU 

对 TDD 的 使 用 没有 推荐 的 最 佳 环境 。 Bel A Ee Bo A R, ARAA 
任务 、 各 种 大 小 和 复杂 度 的 项 目 均 适用 。 比 如 , 试验 没有 汪清 TDD 实 践 古 否 对 开发 朋 入 式 系 
统 或 高 分 散 系 统 适 用 ,在 这 些 系 统 中 增 量 式 测试 可 能 不 切实 际 。 此 外 ，TDD 在 遗留 系统 中 的 
使 用 一 直 是 个 问题 ， 这 样 的 系统 可 能 需要 对 现 有 代码 大 量 的 重 构 之 后 才 会 变 得 可 测 |。 
*HUUUUUUU 

PAARA TA EA SE Se: 学 习 TDD 很 困难 。 它 伴随 着 一 条 很 陡峭 的 学 习 曲 线 ， 需 
要 技巧 、 成 熟 度 和 时 间 ， 特 别 古 当 开发 人 员 已 经 形成 了 编码 再 测试 的 习惯 定式 之 后 。 如 琳 有 
更 好 的 产生 测试 用 例 的 工具 , 或 在 教育 过 程 中 更 早 地 传播 测试 再 编码 的 习惯 ,也 许可 以 鼓励 
TDD 的 使 用 。 
eHUUU 

我 在 与 TDD 开 发 者 的 私下 交流 中 得 知 , 它 古 一 个 上 类 的 实践 。 它 改变 了 人 们 的 思维 习惯 ， 
也 改变 了 人 们 的 编码 方法 ， 很 难 回 退 。 因 此 ， 放 弃 ITDD 实 践 与 采用 它们 一 样 困难 。 
e 00000000L 

我 们 选择 的 研究 中 设 有 特别 针对 TDD 与 别 的 药物 同时 服用 时 的 效 末 的 。 一 个 试验 显示 ， 
在 与 预先 设计 结合 使 用 时 ，TDD 提 升 了 40% 的 外 部 质量 ”。 另 一 个 试验 对 比 了 单 人 和 结对 开 
发 人 员 , 他 们 实践 了 TDD 和 最 后 测试 的 增 量 式 开发 方法 ,那个 试验 结果 显示 在 软件 外 部 质 
量 上 没有 区 别 。 我们 还 不 知道 哪个 实践 与 TDD 合 用 会 产生 好 或 坏 的 效 坟 。 虽然 也 许 有 些 实践 
促进 了 那些 预期 效 末 ， 也 有 另外 一 些 抑制 了 它们 。 之 前 提 到 的 例子 可 能 是 基于 具体 和 案例 的 ， 
但 是 它们 指出 了 需要 对 TDD 与 其 他 药物 交互 作用 的 进一步 调查 。 
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12.6 Zit 


TDD 的 效 末 仍然 奉 涉 许多 未 知 数 。 确 实 ， 对 于 我 们 所 使 用 的 任何 度量 ITDD 效 朱 的 方法 ,包括 
内 部 质量 、 外 部 质量 、 生 产 力 和 测试 质量 , 得 出 的 证 据 都 不 是 完全 一 致 的 。 多 数 的 予 盾 可 能 来 日 
于 TDD 试 验 对 内 在 因素 的 不 完全 捅 述 。 因 此 ，TDD 仍 然 注 定 古 辩论 和 人 研究 的 争议 性 话题 。 

对 寻求 一 些 实践 建议 的 从 业者 来 说 , 我 们 的 专家 小 组 推荐 使 用 TDD 药 丸 ， 小 心 监控 它 的 反应 
和 副作用 ， 并 相应 增加 或 减少 剂量 。 所 以 ， 我 们 在 总 结 数据 后 由 小 组 中 的 个 人 提出 了 一 些 处 方 。 


我 们 虽然 已 经 汇集 了 所 有 证 据 ， 但 是 每 个 读者 必须 得 出 自己 的 想法 。 首 先 ， 判定 哪 
个 特性 对 你 来 说 最 重要 。 比 如 ， 你 是 否 更 关注 生产 力 或 外 部 质量 ? 你 能 证 明 花 更 多 精力 
创造 更 高 质量 的 测试 是 值得 的 吗 ? 这 章 提 出 的 证 据 只 能 用 于 读者 基于 自己 的 目标 做 出 
自己 的 决定 。 

我 已 经 使 用 了 IDD 药 丸 ， 而 且 已 经 上 净 了 。 我 的 个 人 经 验 是 ，TDD 能 增加 生产 力 ， 
虽然 这 份 研究 缺乏 这 方面 的 证 据 。 也 许 我 的 想法 只 是 一 种 感觉 。 基 于 这 些 结果 ， 特 别 是 
关于 对 外 部 质量 正面 影响 的 证 据 ， 如 果 我 没有 准备 好 使 用 TDD, 我 会 让 我 的 团队 先 服用 
小 剂量 ， 然 后 看 看 他 们 自己 是 否 感觉 会 有 长 期 生产 力 的 增长 。 如 果 没 有 不 良 反 应 ， 我 会 
慢 慢 增加 药 量 并 持续 观察 。 

虽然 TDD 很 有 前 景 ,对 它 效力 的 不 确定 性 和 前 期 使 用 的 高 成 本 会 阻止 它 的 使 用 。 尽 
管 如 此 ,， 它 的 成 分 似乎 能 鼓励 好 的 编码 和 编程 习惯 的 产生 ， 长 期 来 说 能 产生 更 高 质量 的 
程序 员 和 测试 。 

虽然 看 起 来 很 有 前 途 ， 但 是 有 些 事实 我 们 必须 面 对 ， 它 初 党 时 很 苦 。 很 多 人 更 喜欢 
卓 东 西 。 毕 竟 ， 当 你 花 大 把 时 间 写 失败 测试 用 例 的 时 候 很 难 感到 有 生产 力 。 从 另 一 个 角 
度 说 ,我 这 草 子 从 未 写 出 过 更 干净 的 代码 了 。 当 我 改变 上 昌 人 代码, 点击“ 运行 测试 ”按钮 ， 
并 确信 我 没有 破坏 任何 东西 的 时 候 ， 感 觉 棒 极 了 |! 

这 章 中 包含 的 证 据 只 能 证 明 TDD 可 能 冶 好 你 , 但 是 你 不 应 该 把 它 当 成 万 能 药 。 你 的 
TDD 征 途 可 能 因为 某 些 因素 而 变化 ， 和 包括 你 的 经 验 和 你 的 工作 环境 。 作 为 一 个 从 业者 ， 
何 时 应 该 期 待 TDD 带 来 改进 是 一 种 应 该 培养 的 洞察 力 ， 它 也 会 是 一 份 很 有 价值 的 资产 。 
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本 身 就 会 出 错 的 思维 框架 不 能 用 来 解决 问题 。 
一 一 发 因 斯 坦 


这 里 有 一 组 统计 数字 : 女生 从 幼儿 园 到 大 学 的 成 绩 都 比 男生 高 ， 包 括 数学 。 根 据 我 们 所 能 掌 
担 的 最 新 的 数据 来 看 ， 大 学 的 数学 专业 学 生 中 , 女性 占 了 48%,， 参 加 先 修 课 程 (AP) 考试 的 考生 
中 女性 占 了 56%， 参 加 微 积分 AP 考试 的 考生 中 ， 女 性 也 占 到 了 51%- 一 。 然 而 ， 同 年 计算 机 科学 
AP 考 试 的 考生 中 ， 女 性 却 只 占 到 了 17%t 7 

同样 的 ， 虽然 2008 年 所 有 本 科学 位 获得 者 中 女性 占 了 57%, 但 是 计算 机 科学 (CS) 和 信息 技 
AIT) 的 学 位 获得 者 中 ， 女 性 只 占 18%M1。 奇怪 的 是 ，23 年 前 (1985 年 ) 计算 机 科学 学 十 学 位 
获得 者 中 ， 女 性 的 比例 曾 高 达 37% 中 。 从 2001 年 至 2008 年 ,计算 机 科学 本 科 的 女性 入 学 人 数 下 降 
T79% P, 

为 什么 计算 机 科学 中 女性 这 么 少 呢 ? 我 们 应 该 关心 这 个 现象 吗 ? 如 果 答 案 是 肯定 的 话 , 我 们 
可 以 做 些 什么 来 扭转 这 种 趋势 呢 ? 对 这 些 问 题 的 争论 分 为 三 大 类 。 

一 些 人 认为 ,女性 相 较 于 男性 而 言 ,不 太 可 能 拥有 极端 优秀 的 认 知 能 力 ， 而 这 种 能 力 在 计算 
机 科学 领域 很 重要 中 1, 

也 有 人 说 ， 女 性 对 计算 机 科学 不 感 兴趣 ， 喜 欢 研究 其 他 领域 "中, 还 有 人 认为 ， 是 各 种 
成 见 和 偏见 以 及 “男性 文化 ”把 女性 赶 出 了 这 个 领域 1 。 

本 章 回 顾 了 与 这 三 个 观点 相关 的 研究 ， 并 探讨 其 意义 。 


13.1 为 什么 女性 很 少 
首先 让 我 们 研究 一 下 这 个 问题 的 通常 解释 以 及 相关 的 研究 。 
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13.1.1 ”能力 缺陷 ， 个 人 喜好 以 及 文化 偏见 


对 于 在 科学 、 技 术 、 工 程 和 数学 领域 (STEM) 阳 盛 阴 误 的 问题 ， 人 们 已 经 做 了 大 量 的 研究 ， 
包括 先天 能 力 差 异 、 个 人 喜好 和 文化 偏见 等 原因 。Ceci、Williams 和 Barnett 开 发 了 一 种 框架 ， 研 
究 各 种 因素 之 间 的 相互 影响 “。 接 下 来 ,我 们 将 研究 每 个 因素 ， 然 后 用 Ceci 等 人 的 整合 框架 来 综 
合 分 析 。 研 究 得 出 的 图 表 〈 见 图 13-1) 让 人 们 感到 这 些 因素 之 间 存 在 非常 复杂 的 相互 影响 。 虽 然 
生物 学 意义 上 的 性 别 差异 会 起 一 定 的 作用 , 但 研究 表明 ,也 有 可 能 与 不 良 的 性 别 歧视 有 关 ， 这 就 
提出 了 进一步 的 问题 。 

1. 女性 数学 空间 能 力 缺 陷 的 证 据 

研究 人 员 已 经 对 男性 和 女性 先天 能 力 的 差异 (以 及 孩童 时 代 的 经 历 及 环境 导致 的 差异 ) 进行 
TRA, 并 把 它 作 为 一 种 可 能 的 原因 来 解释 为 什么 女性 在 计算 机 相关 领域 越 来 越 少 。 有 大 量 证 据 
表明 女性 在 数学 密集 型 任务 上 不 如 男性 。 这 种 性 别 不 对 称 存在 于 能 力 分 布 的 最 上 端 。 例 如 ，SAT 
数学 成 绩 前 1% 的 学 生 中 男女 比例 是 2 比 1， 前 0.01% 学 生 中 的 比率 是 4 比 1“ 1 Wl。 但 分 数 最 低 的 学 
生 中 ， 男 性 也 占 大 多 数 ， 这 意味 着 男性 整体 表现 差异 很 大 。 

Ceci、Williams 和 Barnett "把 认 知性 别 差异 的 证 据 分 为 平均 差异 (分 布 的 中 点 ) , 右 尾 差异 (最 
优秀 的 10%，5% 和 1%)， 后 者 更 好 地 代表 了 从 事 科 学 、 技 术 、 工 程 和 数学 (STEM) 的 人 群 。 根 
据 美 国 1960 年 ~1992 年 对 青少年 的 概率 抽样 ，Hedges 和 Nowel 发 现 男性 和 女性 考生 的 考试 成 绩 分 
布 在 最 高 和 最 低 的 1%，5% 和 10% 中 差异 很 大 。 男 性 在 科学 、 数 学 、 空 间 推理 、 社 会 研究 和 机 
械 技能 上 表现 出 色 。 女 性 在 口头 表达 能 力 、 联 想 记 忆 表 现 和 感知 速度 上 胜出 。 这 些 发 现 提 出 了 一 
个 可 能 性 ，CS 和 IT 相 关 领 域 的 性 别 分 布 可 能 和 生理 特性 有 关 。 

大 脑 的 相对 大 小 、 脑 组 织 、 荷 尔 蒙 差异 的 研究 也 与 之 相关 。Ceci 和 Williams 查 看 了 近期 生物 
学 上 有 关 认 知性 别 差 异 的 研究 ， 调 查 了 大 脑 体积 、 脑 组 织 和 激素 的 差异 ”“。Deary 等 人 发 现 了 智 
力 与 脑 容积 的 适度 相关 性 (0.33~0.37) 1, 而 男性 平均 大 脑 容量 大 于 女性 。 在 讨论 这 项 研究 时 ， 
Ceci 和 Williams 指 出 :“ 大 多 数 关 于 性 别 差 异 的 生物 研究 关 广 的 是 平均 值 ， 而 STEM 领域 的 性 别 差 
异 研 究 关 注 的 是 最 右 尾部 值 最 高 的 1%， 甚 至 最 高 0.1% 或 最 高 0.01%) 。” 换 句 话 说， 大 脑 平 均 差 
异 的 研究 并 不 切合 我 们 的 问题 ， 因 为 能 证 明 男 女 之 间 数 学 和 空间 能 力 差 异 的 有 力 证 据 ， 只 会 出 现 
在 能 力 分 数 范 围 的 最 顶部 (或 底部 )。 

其 他 被 Ceci 和 Williams 引 用 的 研究 ， 指 出 男性 和 女性 使 用 不 同 的 大 脑 部 位 来 完成 相同 的 任 
务 …“。Ceci 和 Williams 得 出 结论 :“ 基 于 其 他 独立 的 重复 实验 和 有 代表 性 的 取样 ， 可 以 总 结 得 出 男 
性 和 女性 使 用 不 同 的 大 脑 结 构 来 实现 相同 的 一 般 认 知 能 

此 外 ，Ceci 和 Williams 引 用 了 一 项 研究 ， 该 研究 考察 了 出 生前 和 出 生 后 激素 对 于 认 知 性 别 差 
异 的 影响 。 在 这 项 研究 中 ， 雄 性 老鼠 比 雌性 老鼠 更 快走 出 迷宫 。 一 旦 雄性 老鼠 被 阅 割 ， 他 们 的 优 
势 就 消失 了 。Ceci 和 Williams 还 回顾 了 田 一 个 研究 ， 在 变性 手术 时 ， 女 性 如 果 服 用 大 量 的 抑制 肉 
激素 药物 ， 并 摄 入 大 剂量 的 男性 荷尔蒙 ,会 增强 空间 能 力 。 这 一 领域 的 大 量 研究 指出 ， 和 荷尔蒙 可 
能 会 影响 妇女 的 专业 选择 。 不 过 ， 目 前 还 不 清楚 影响 会 有 多 大 。Ceci 和 Williams 认 为 :“ 设 有 足够 
强 有 力 和 一 致 的 证 据 能 表明 激素 是 STEM 领域 性 别 差 异 的 主要 原因 。 
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在 结束 荷尔蒙 差异 的 讨论 前 , 我 们 应 该 考虑 它 是 否 导致 了 一 些 行为 差异 , 使 得 计算 机 相关 工 
作对 女性 的 吸引 力 没有 对 男性 大 。 

统计 表明 ， 妇 女 都 致力 于 专业 工作 。2008 年 ， 美 国 57% 的 专业 工作 由 女性 承担 中 |， 同 时 她 
们 在 数学 这 门 与 计算 机 密切 相关 的 学 术 学 科 中 也 十 分 成 功 ( 按 成 绩 来 衡量 )。 由 此 看 来 ， 我 们 似 
平 需要 跳 过 能 力 不 足 的 解释 , 来 询问 女性 自己 的 选择 。 统 计 结 果 表 明 ， 我 们 需要 对 影响 女性 决定 
是 否 从 事 计算 机 领域 的 因素 进行 性 别 敏感 研究 。 我 们 还 需要 考虑 女性 是 否认 为 自己 在 CS 的 男性 
文化 下 被 剥夺 了 权利 。 如 果 ， 这 里 真 的 藏 有 性 别 失衡 的 重要 原因 ， 那 么 这 里 也 可 能 存在 一 个 机 会 
来 扭转 这 一 趋势 。 

2. 个 人 喜好 和 生活 方式 选择 所 起 的 作用 

与 此 同时 , 一 些 研究 人 员 强 调 了 个 人 喜好 和 文化 的 影响 。 有 人 声称 ， 人 们 对 职业 和 生活 方式 
选择 的 固有 印象 是 女性 较 少 选择 计算 机 科学 的 主要 原因 , 更 有 人 强调 , 反对 女性 选择 这 类 职业 的 
文化 压力 是 最 大 的 原因 。 接 下 来 ， 我 们 将 检验 这 些 观点 的 证 据 。 

关于 职业 选择 , 职业 上 的 性 别 交 替 在 历史 上 一 直 出 现 , 尤其 是 在 教学 , 文秘 , 医药 领域 上 站。 
这 些 交替 很 容易 解释 ， 因 为 随 着 时 间 的 推移 ， 这 些 职业 的 威望 和 报酬 发 生 了 变化 ， 而 不 是 受 激素 
或 基因 影响 。 男 性 不 断 接手 被 认为 更 具有 经 济 价值 的 工作 , 这 表明 性 别 劳 动力 模式 更 多 地 受到 文 
化 和 政治 力量 的 驱动 , 而 不 是 简单 的 生物 差异 。 在 最 近 有 关 女 性 选择 从 事 健 康 相关 职业 的 纵向 研 
究 中 ,我们 发 现 了 一 个 文化 价值 驱动 职业 选择 的 有 趣 平行 案例 。Jacqueline Eccles 和 美国 密歇根 大 
学 的 同事 们 发 现 ， 即 使 考虑 到 数学 能 力 ， 年 轻 女 性 更 喜欢 从 事 健 康 相关 的 职业 ， 因 为 较 之 男性 ， 
她 们 认为 面向 人 和 社会 的 职业 更 有 意义 (1。 

Margolis, Fisher 和 Miller “在 他 们 于 2000 年 进行 的 研究 中 ， 更 为 深入 地 证 明了 女性 更 倾向 
于 (或 更 重视 ) 服务 他 人 和 社会 的 选择 。 该 研究 涉及 卡耐基 梅 隆 大 学 计算 机 专业 的 $1 个 男生 与 46 
个 女生 (总共 210 个 访谈 )。 这 里 引述 受 访 者 中 一 位 女性 的 话 ， 呼 应 了 Eccles 的 理论 。 


我 的 想法 是 ， 你 可 以 担 救 生命， 而 不 是 从 社会 中 脱离 出 去 。 这 实际 上 是 把 自己 作为 
社会 的 一 份子 。 这 实际 上 是 帮助 别人 。 因 为 我 内 心 深 处 想 要 提供 帮助 。 我 觉得 我 在 计算 
机 科学 中 的 唯一 的 问题 是 ,我 将 会 脱离 于 社会 ， 而 无 法 对 社会 做 出 什么 贡献 ; 也 无 法 帮 
助 第 三 世界 国家 的 人 民 …… 我 想 找到 一 种 方式 可 以 帮助 别人 ,那样 我 就 愿意 以 计算 机 科 
学 为 职业 了 。 


Margolis、Fisher 和 Miller 发 现 ， 女 性 在 计算 机 中 追寻 以 人 为 本 的 日 标 ， 这 与 计算 机 科学 领域 
WSL eA BPE Ol 他 们 的 调查 指出 ，44% 的 女 学 生 (相对 于 9% 男 性 学 生 ) 强调 用 更 人 
性 化 的 项 目 整 合 人 与 计算 机 的 重要 性 。 总 体 来 看 ， 女 性 更 倾 回 于 医疗 用 途 (如 心脏 起 捕 强 ， 肾 透 
析 机 ， 以 及 找 出 疾病 )、 通 信 、 解 决 社 会 问题 的 计算 ， 而 不 是 单纯 为 了 计算 而 计算 、 为 了 开发 更 
好 的 计算 机 或 编写 游戏 而 计算 。 

Ferriman、Lubinski 科 Benbow 指出 了 一 些 相 似 的 价值 观 问 题 ， 生 活 方式 偏好 和 生活 目标 取 问 
中 的 性 别 差 异 ， 是 女性 在 STEM 领 域 中 人 数 较 少 的 主要 原因 ""。 他 们 的 研究 别具一格 ， 因 为 他 们 
能 够 把 “能 力 ” 保 持 为 常量， 并 把 人 数 范 围 缩 小 到 STEM 领域 中 最 出 色 的 人 群 。 通 过 对 数学 早熟 
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青年 超过 20 年 的 跟踪 ， 他 们 发 现 ，“ 继 完成 研究 生 学 位 后 ， 男 性 更 关注 职业 、 更 个 体 性 ， 而 女性 
似乎 在 生活 目标 取 癌 中 更 全 面 和 公共 ,更 普遍 地 注意 家 庭 、 朋 友 、 上 自己 和 他 人 的 社会 福利 。 那 
么 按 这 种 说 法 ，CS 中 女性 很 少 是 因为 她 们 对 其 他 学 科 和 领域 更 感 兴趣 。 


13.1.2 偏见、 成 见 和 男性 计算 机 科学 文化 


很 多 研究 人 员 拒 绝 接受 女性 内 在 特质 (无 论 能 力 或 兴趣 ) 导致 了 CS 和 IT 界 女性 人 数 很 少 这 一 
说 法 。 他 们 认为 ， 真 正 的 原因 是 CS 的 文化 不 鼓励 女性 加 入 。 在 “计算 机 科学 本 科 女 生 兴趣 剖析 ” 
一 文中 ，Margolis、Fisher 和 Miller 关 注 那 些 来 读 计算 机 时 兴趣 高 涨 的 女生 ， 如 何 很 快 在 这 门 学 科 
中 形 失 了 能 力 和 兴趣 。 他 们 探讨 了 智力 之 外 的 因素 是 如 何在 抽象 的 知识 体 中 影响 兴趣 的 。 例 如 ， 
他 们 探讨 了 带 有 性 别 偏见 的 标准 是 如 何 侵蚀 信心 的 , 以 及 一 个 男性 化 的 成 功 标准 是 如 何 影响 女性 
的 兴趣 和 能 力 的 。 作 者 认为 ， 可 能 会 有 一 些 “ 有 害 方式 ， 甚 中 男性 行为 方式 和 兴趣 成 为 “正确 合 
适 ” 和 成 功 标准 ”， 这 反 过 来 导致 了 女性 对 这 门 学 科 热 情 的 减弱 。 换 名 话说 ， 正 如 他 们 的 访谈 所 
显示 ， 女 性 如 果 拒绝 使 自己 符合 “为 了 入 侵 而 入 侵 的 黑客 ”这 一 “电脑 怪 杰 ”形象 的 话 ， 会 被 认 
为 是 脱离 这 个 群体 的 。 

对 那些 认为 计算 机 科学 文化 就 是 “神童 ” 们 一 个 个 夜以继日 独自 狂热 编程 的 人 ，Margolis、 
Fisher 和 Miller 引 用 了 女 计算 机 科学 老师 的 一 段 话 ， 

我 的 观点 是 , 诸 夜 做 事情 是 表示 专心 以 及 对 这 个 学 科 的 热爱 ,也 可 能 意味 着 不 成 熟 。 

女孩 们 对 电脑 和 计算 机 科学 的 热爱 表现 得 非常 不 同 。 如 果 你 正在 寻找 这 种 着 魔 的 行为 类 

型 ,你 是 正在 寻找 一 个 典型 的 青年 男性 的 行为 。 虽 然 有 些 女生 也 会 如 此 , 但 大 部 分 不 会。 

不 过 ， 这 并 不 意味 着 她 们 不 爱 计算 机 科学 | 


Margolis、Fisher 和 Miller 案 例 的 缺陷 在 于 他 们 只 研究 了 修 读 计算 机 科学 的 一 小 部 分 人 。 因 此 ， 
对 于 把 他 们 的 结论 推广 到 更 广泛 的 群体 , 我 们 持 谨慎 态度 。 我 们 不 能 基于 小 样本 群 得 出 广泛 适用 
的 论断 。 此 外， 尽管 他 们 的 面试 问题 是 为 了 使 学 生根 据 自 己 的 经 验 而 非 抽 象 思维 回答 ， 作 者 们 自 
己 也 承认 了 这 种 采访 技巧 不 利于 对 不 同 的 独立 因素 分 配 相 对 权重 , 因为 “因素 经 党 转移 而 且 似 平 
相互 纠缠 ”中 

同时 ， 这 些 研究 结果 与 其 他 对 于 计算 机 文化 的 研究 相 呼 应 ， 比 如 一 个 由 美国 大 学 妇女 协会 
(AAUW) 的 教育 基金 所 做 的 研究 。 该 研究 结合 了 14 个 网 络 文化 与 教育 专员 提供 的 数据 (研究 人 
i, 教育 工作 者 、 新 闻 工 作者 以 及 企业 家 )。 他 们 的 报告 涵盖 了 基金 会 对 于 900 名 教师 的 在 线 调 查 、 
对 70 多 名 女性 的 定性 焦点 研究 和 对 现 有 研究 的 评审 , 为 的 是 对 计算 机 文化 、 教 师 观 点 和 课堂 互动 、 
教育 软件 和 游戏 ,计算 机 科学 教室 ,家庭 社区 和 工作 等 诸多 方面 提供 深入 洞察 观点 "1, Margolis, 
Fisher 和 Miller 一 样 , AAUW 也 发 现 计算 机 科学 文化 对 于 女性 的 威慑 作用 。 他们 发 现 女孩 都 担心 她 
们 像 工 具 一 样 被 动 地 与 电脑 互动 。 此 外 ， 他 们 还 发 现 ， 女 孩 抵制 计算 机 游戏 中 的 暴力 、 元 余 和 沉 
问 , 也 对 纯 技 术 的 编程 课程 感到 反感 。 此 外 , AAUW 和 争辩 说 , 这 些 担 忧 是 因为 紧张 或 是 能 力 不 济 ， 
一 旦 技术 能 力 赶 上 ， 便 会 消失 。 

最 后 ， 在 一 个 对 IT[、CS 和 CE 研究 的 综合 汇编 中 ，McGrath Cohoon 和 Aspray 集 合 了 该 领域 34 




















13.1 为 什么 女性 很 少 167 


个 主要 研究 人 员 的 研究 ,他 们 对 于 女生 数量 少 的 潜在 解释 包括 : 经 验 、 入 门 障碍 、 榜 样 、 辅 导 、 
师 生 互动 、 同 学 支持 、 课 程 和 教学 方法 ， 以 及 如 学 术 适 合 度 、 价 值 、 信 心 和 如 何 面 对 竞争 等 学 生 
特质 ， 外 加 计算 机 文化 。 

受 基于 文化 的 关注 启发 , 我 们 可 能 会 问 ， 那些 没有 选择 计算 机 的 高 能 力 的 女性 们 选择 了 什么 
职业 呢 ?Ceci、Williams 和 Barnett 提 醒 我 们 ， 数 学 能 力 强 的 女性 比 男性 更 有 可 能 同时 具有 较 强 的 
语言 能 力 ， 这 种 不 成 比例 的 优势 让 她 们 有 更 广泛 的 职业 选择 权 -… 。 因 此 , 文化 因素 和 个 人 选择 相 
又 加 ,使 得 有 能 力 的 女性 离开 了 计算 机 领域 ,从 而 揭示 生理 因素 和 纯粹 能 力 并 非 唯 一 的 原因 。 图 
13-1 揭 示 了 这 些 生 理 ， 文 化 因素 的 互相 影响 。 
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Stephen J. Ceci, Wendy M. Williams, LAX Susan M. Barnett 所 有 ; 授权 使 用 
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领域 可 能 面临 的 障碍 。 另 一 方面 ， 我 们 对 于 多 种 相互 联系 、 影 啊 女 性 全 面 参与 的 力量 有 了 更 多 的 
了 解 ， 这 给 了 我 们 如 下 局 发 。 
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在 某 种 程度 上 , 女性 不 选择 计算 机 科学 古 因为 文化 中 的 困扰 因素 ,而 这 些 因 素 古 可 以 改变 的 ， 
但 我 们 要 问 目 己 的 是 应 不 应 该 把 更 多 的 女性 推 入 计算 机 科学 呢 , 比如 通过 教育 政策 ”因为 计算 机 
征 一 个 理想 的 职业 ， 女 性 有 更 多 机 会 从 事 该 职业 必然 会 得 益 。 而 且 ， 计 算 机 征 全 球 苋 争 的 领域 ， 
性 别 的 包容 性 会 市 来 好 处 。 另 外 ， 多 样 性 会 改进 计算 机 和 软件 团队 的 产品 。 

然而 ,这 个 问题 的 最 终 意 义 可 能 比 任何 可 立即 衡量 的 益处 要 大 得 多 。 目 前 研究 的 不 足 也 许 是 
在 建议 我 们 换 一 个 思路 : 承认 生物 差异 和 文化 影响 的 诸多 特质 是 这 个 复杂 方程 式 的 关键 因素 。 

首先 ,让 我 们 说 明 女 性 参与 CS 的 芍 在 利益 。 第 一 ,II 职位 的 新 酬 大 大 超过 大 多 数 女 性 为 主 的 
职业 ”“。 据 美国 大 学 与 雇主 协会 的 数据 显示 ，2009 年 7 月 计算 机 科学 学 士 学 位 的 毕业 生 的 平均 起 
薪 为 61 407 美 元 “。2008 年 5 月 , 计算 机 系统 软件 工程 师 的 行业 最 普遍 年 薪 的 中 位 数 为 : 研发 部 门 ， 
102 090 美 元 ;电脑 及 周边 设备 制造 业 ，101 270 美 元 ;软件 出 版 商 ，935 790 美 元 ;电脑 系统 设计 
及 相关 服务 ，91 610 美 元 。 

美国 芬 工 统计 局 把 计算 机 软件 工程 师 的 就 业 前 景 评 为 优秀 。 展 望 2008 年 至 2018 年 , a7 Lit 
局 网 站 预测 就 业 比 例 的 变化 为 :计算 机 软件 工程 师 和 计算 机 程序 员 会 增加 28.3 万 个 职位 ,增长 21% 
的 ; 计算 机 软件 工程 师 会 增加 29.5 万 个 就 业 机 会 ， 增 长 32%; 软件 工程 师 会 有 34% 的 增幅 。 只 
在 程序 员 岗 位 显示 有 3% 下 降 。 因 此 ，CS 是 一 个 具有 民 好 报 柄 和 民 好 就 业 前 景 的 新 兴 领 域 。 

预计 到 2016 年 ， 相 对 于 其 他 STEM 职 业 ， 计 算 机 产业 将 有 最 大 的 经 济 增长 和 需求 (图 13-2)。 














预计 2006 年 -2016 年 STEM 职业 百分比 变化 


行业 平均 

网 络 系统 分 析 员 
计算 机 软件 工程 师 
计算 机 系统 分 析 员 


电气 工程 师 
机 械 工程 师 


0 10% 20% 30% 40% 50% 60% 


Bureau of Labor Statistics, Monthly Labor Review, November 2007 





13-2 ”预计 2006 年 ~2016 年 STEM 职业 百分比 变化 


技术 类 工作 机 会 的 增长 预计 比 其 他 专业 工作 更 快 ， 在 未 来 十 年 涨幅 将 高 达 25%”。 考 虑 到 
庞大 的 需求 和 就 业 机 会 延续 到 2018 年 ,一 个 男性 为 中 心 的 工作 文化 可 能 会 阻止 女性 从 CS 职业 中 
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更 多 女性 参与 到 计算 机 行业 会 得 到 的 经 阐 利 益 是 显而易见 的 , 但 除了 这 些 , 让 女性 能 参与 到 
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所 有 专业 领域 (包括 计算 机 ) 所 带 来 的 益处 会 更 大 。 美国 需要 有 能 力 的 人 从 事 计算 机 相关 的 工作 ， 
并 且 要 做 好 。 美 国 劳工 部 估计 ， 到 2016 年 ， 将 有 超过 150 万 个 计算 机 相关 的 工作 ”。 

尽管 美国 的 科技 产业 古 发 展 最 快 的 产业 之 一 ， 按照 目 前 的 趋势 ,到 2016 年 ， 美国 计算 机 科学 
本 科 和 毕业 生 只 能 填补 该 产业 一 半 的 职位 ”"。 换 名 话说 ,无 论 男女 ， 只 要 具有 潜力 和 能 力 的 人 参与 
XML, AEM LSS A MAY. 

除 此 之 外 ， 性 别 平衡 会 有 男 一 些 益 处 ， 比 如 多 样 性 。 事 实 上 , 一些 学 者 曾 提 出 多 样 性 ， 包 括 
性 别 多 样 性 ,会 提高 团队 表现 ， 虽 然 不 征 所 有 的 学 者 都 同意 这 种 说 法 ， 因 为 往往 这 种 说 法 是 基 于 
社会 政治 基础 而 不 古 学 术 基 础 。 围绕 上 自我 分 类 、 社 会 身份 和 相似 性 吸引 的 研究 容易 对 多 样 性 产生 
悲观 的 看 法 ， 而 信息 处 理 方法 却 容易 得 出 乐观 的 结果 。 正 如 Mannix 和 Neale 的 解释 ”: 


围绕 自我 分 类 /社会 身份 和 相似 性 吸引 的 研究 容易 对 团队 中 的 多 样 性 抱 有 悲观 的 看 
法 。 在 这 些 模式 中 , 个 人 会 更 被 其 他 类 似 的 人 吸引 , 同 质 团队 会 更 有 凝聚 力 ,， 更 加 融合 。 
相反 ,信息 处 理 的 角度 提供 了 更 为 乐观 的 观点 : 多 样 性 可 以 提高 团队 工作 表现 。 信 息 处 
理 的 观点 认为 ,在 相 央 的 群体 中 ,个 人 会 接触 到 背景 、 社 交 网 络 、 信 息 和 技能 完全 不 同 
的 人 。 这 些 信息 会 改善 团队 的 成 果 ， 尽 管 它 可 能 造成 该 组 的 协调 问题 。 


Page 作 为 多 样 化 的 提倡 者 ， 认 为 在 适当 的 条 件 下 ， 多 样 化 的 团队 一 贯 跑 赢 由 “能 力 最 佳 ”者 
组 成 的 团队 一。 基于 他 在 复杂 系统 、 经 济 学 、 政 治学 上 的 广泛 工作 成 果 ，Page 声 称 进 步 不 仅 取决 
于 个 体 智 商 ， 也 同样 取决 于 集体 差异 。 

在 对 IT 工作 环境 多 元 化 益处 的 研究 表明 男女 数量 相同 的 团队 〈 比 任何 其 他 比率 组 成 的 团队 ) 

会 尝试 、 创 新 、 分 享 知识 、 完 成 任务 “ 1。 并且 ， 由 男女 共同 组 成 的 团队 所 获得 的 专利 ， 被 引用 
的 次 数 往往 比 同类 型 的 专利 多 26% 一 42%”。 

关于 这 一 课题 的 研究 往往 认为 多 样 性 会 提高 团队 的 表现 ,但 我 们 也 必须 看 到 ,社会 学 家 们 50 
年 来 的 研究 结果 表明 ， 优 势 并 没有 那么 明确 。Mannix 和 Neale[29] 在 报告 的 第 237 页 指出 ， 任 期 多 
样 性 (雇员 任职 长 度 的 多 样 性 ) 对 工作 表现 有 不 恨 影响 。 社 会 分 类 上 的 多 样 性 ， 比 如 在 年 龄 、 性 
别 和 种 族 因素 上 的 多 样 性 所 带 来 的 影响 似乎 时 好 时 坏 , 而 其 结果 又 与 比例 直接 相关 ( 即 少 数 派 与 
多 数 派 之 间 的 比率 )。 在 一 个 大 规模 、 包 含 四 个 研究 的 项 目 中 ,研究 人 员 测 量 了 种 族 和 性 别 多 样 
性 对 于 进度 和 表现 的 影响 。Kochan 和 同事 们 发 现 , 性 别 差 异 对 于 团队 进度 要 么 没有 影响 , BEALE 
有 积极 的 影响 ， 而 种 族 多 样 性 往往 有 人 负面 影响 “。 虽 然 Kochan 和 他 的 同事 认为 无 论 哪 种 多 样 性 ， 
都 很 少 有 直接 影响 ， 他 们 也 表示 环境 因素 (团队 间 的 竞争 ) 加 剧 了 种 族 多 样 性 的 负面 影响 。 

有 趣 的 是 ，Sackett 和 同事 提出 : 在 评估 多 样 性 的 益处 时 ， 绩 效 究竟 是 如 何 被 评估 的 。 也 就 
是 说 ， 作 者 们 意识 到 绩效 考评 很 坏 手 。 在 控制 了 男性 与 女性 的 认 知 能 力 、 心 理 能 力 、 教 育 水 平和 
经 验 的 差异 之 后 ， 当 女性 的 比例 很 小 时 ， 女 性 的 绩效 评级 较 低 。Sackeet 和 同事 们 发 现 ， 当 女性 的 
比率 小 于 20% 时 ， 她 们 的 绩效 评级 低 于 男性 ， 但 当 比例 大 于 5$0% 时 ， 她 们 的 评级 高 于 男性 。 没 有 
在 男性 的 评级 中 发 现任 何人 数 比率 和 评级 的 平行 关系 。 由 于 评估 者 的 性 别 设 有 记录 ,其 他 解释 可 
能 包括 对 于 集体 诉讼 的 候 惧 或 害怕 歧视 索赔 ， 这 些 都 难以 评估 。 

换 名 话说， 研究 人 员 缺 乏 可 信 的 手段 来 衡量 多 样 性 〈 至 少 对 绩效 ) 的 影响 。 提 高 女性 比例 是 
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能 真正 提高 绩效 ， 或 者 是 有 一 些 其 他 六 在 因素 造成 了 绩效 提高 的 感觉 ? 怎样 研究 公开 多 样 性 
(5B. &, BA, BA) 才能 同时 适当 地 评估 相似 和 差异 的 价值 和 对 其 的 态度 ? 性 别 、 种 族 不同 ， 
但 态度 和 价值 观 相 似 的 团队 是 异 构 还 是 同 构 团队 呢 ?” 显 然 , 需要 定义 一 些 参 数 , 制定 有 效 的 人 衡量 
方法 是 这 方面 研究 的 困难 之 处 。 

面 对 这 些 困 惑 ， 职 工 多 元 化 的 入 在 好 处 之 一 是 财政 奖励 ， 这 值得 注意 。2006 年 Catalyst 的 一 
项 研究 发 现 ， 公 司 董 事 会 成 员 女 性 比率 越 高 ， 公 司 效 益 越 好 。 人 研究 再 称 从 净 资 产 收 益 率 、 销 售 和 
和 资 资本 的 回报 来 说 ,董事 会 成 员 的 女性 比例 高 的 公司 收益 超出 最 低 的 公司 53%、42%、66%”1。 
此 前 , 2004 年 Catalyst 的 一 项 研究 表明 , 女性 领导 比例 最 高 的 公司 股本 回报 率 比 其 他 公司 高 35.1%， 
股东 回报 高 34%。 但 是 ， 这 些 结 果 可 能 是 因为 进取 心 而 不 是 性 别 。 些 外 ，Adams 和 Ferreira 发 现 性 
别 多 样 性 对 市 场 估 值 和 经 营业 绩 的 影响 是 负面 的 。 这 种 负面 效应 ， 他 们 解释 ， 可 能 是 由 公司 股 
东 权 利 强 大 造成 的 。 股 东 权 利 较 弦 的 情况 下 ， 性 别 多 样 性 有 积极 的 效 末 。 因 此 ， 考 虑 到 Catalyst 
的 研究 人 员 无 法 控制 如 企业 的 态度 和 股东 参与 这 些 变量 ， 我 们 需要 质疑 其 “面值 ”的 结论 。 

同样 要 关注 的 是 政和 治 上 的 强制 措施 造成 的 理事 会 性 别 多样 性 。2003 年 ,挪威 议 会 通过 了 一 项 
法 律 ， 要 求 所 有 公共 有 限 公 司 的 任 事 会 中 ， 至 少 有 40% 是 女性 。 目 那 时 以 来 ， 密 歇 根 大 学 的 研究 
人 员 就 开始 调查 该 法 律 的 后 果 。Ahern 和 Dittmar 发 现 了 对 公司 价值 的 负面 影响 ， 但是， 他 们 很 快 
就 指出 ,造成 损失 并 不 是 因为 新 任 董 事 会 成 员 的 性 别 , 而 是 由 她 们 的 低龄 化 和 缺乏 高 层 工 作 的 经 
验 趾 。 一 味 关注 性 别 的 多 样 性 而 使 董事 会 人 员 的 经 验 降低 ， 至 少 在 短期 内 ， 损 害 了 个 别 公司 的 利 
益 。 这 项 强制 政策 的 长 期 结 采 还 有 竺 观察。 

最 后 ， 有 些 人 认为 ， 一 个 多 元 化 的 员工 队伍 促进 创新 。1980 年 ~2005 年 IT 类 别 中 专利 申请 数 
量 大 幅 增 长 ， 但 美国 女性 的 专利 增长 更 为 显 阁 。 从 1980~1985 年 间 ， 美 国 所 有 的 I 专利 (同时 包 
括 两 个 性 别 ) 数量 从 32 000 余 个 增长 到 176 0004874, BASH, ZERIT, 美国 女性 的 IT 专 
利 数量 从 707 增 长 到 超过 10 000， 翻 了 14 香 。 这 一 点 尤其 值得 注意 ， 因 为 IT 界 就 业 女 性 所 占 比例 
仍 相对 固定 中 。 此 外 ， 女 性 影响 80% 的 消费 者 支出 决定 ， 但 90% 的 技术 产品 和 服务 是 由 男性 设计 ， 
这 里 有 一 个 潜在 的 未 开发 的 女性 市 场 ' 1 技术 设计 过 程 中 女性 的 加 入 , 可 能 意味 着 市 场 上 会 出 现 
更 多 有 苋 争 力 的 产品 。 

W. A. Wulf, 是 美国 国家 工程 院 院 长 ， 对 于 多 样 性 有 如 下 观点 :“ 没 有 多 样 性 ， 我 们 就 限制 了 
所 应 用 过 的 生活 经 验 集 合 ,， 结果 我 们 会 付出 机 会 成 本 ， 它 们 存在 于 那些 未 生产 的 产品 ， 欠 考虑 的 
设计 ,不 理解 的 约束 ， 以 及 未 发 明 的 流程 。 男 一 方面 ， 有 关 对 多 样 性 的 研究 ， 麻 省 理工 学 院 省 
理 与 工程 教授 Thomas A. Kochan 说 过 :“ 多 元 化 产业 的 根基 是 不 牢靠 的 。 花 言 巧 语 的 多 元 化 商业 
案例 是 幼稚 而 做 作 的 。 在 商业 绩效 上 ， 性 别 和 种 族 的 多 样 性 设 有 很 强 的 正面 或 者 负面 影响 力 。 
但 他 也 际 认 ,“ 社 会 意义 上 ， 我 们 的确 需要 在 所 有 组 织 中 推广 多 元 化 ， 而 且 随 着 时 间 的 推移 ， 当 
劳动 力 市 场 变 得 更 加 多 元 化 时 ， 机 构 绝对 需要 加 强 这 种 能 力 来 保持 战斗 力 生 。” 所 以 对 当前 状况 
最 简短 的 总 结 是 ， 性 别 多 元 化 有 好 处 ， 但 也 有 开销 。 


13.2.1 扭转 这 种 趋势 ， 我 们 可 以 做 些 什么 
关于 在 CS 专业 中 性 别 失 衡 原 因 的 研究 ，51| 发 了 不 少 充 满 激情 的 辩论 ， 提 出 了 对 改变 的 需求 。 
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HEN GH, KEE Tn SIL, WR 〈 其 中 新 医学 博士 中 50% 是 女性 ) 、 兽 
E (其 中 新 兽医 中 76% 是 女性 ) 以 及 诸如 生物 学 领域 (其 中 女性 男性 人 数 均衡 )。 但 是 ， 如 果 社 
会 布 户 探索 鼓励 更 多 的 妇女 进入 计算 机 领域 的 可 能 性 , 我 们 可 以 做 什么 ?计算 机 界 绝 大 多 数 症 男 
性 的 现状 能 得 到 扭转 么 ? 季 运 的 是 ， 已 经 有 人 研 究 探 索 了 女性 在 CS 领域 人 数 很 少 的 原因 ， 也 有 了 
相关 的 研究 来 探讨 在 文化 、 课 程 、 信 息 和 政策 方面 的 可 能 干预 措施 。 

在 专科 教育 里 ,卡耐基 梅 隆 大 学 的 首创 研究 为 CS 教学 提供 了 循 证 干预 的 优秀 疙 例 。 这 些 方 法 
包括 把 不 同 育 景 的 学 生 一 起 市 到 跨 学 科 课 程 中 共同 处 理 多 元 问题 , 本科 教育 中 对 人 机 交互 的 关注 ， 
以 及 让 学 生 参 与 与 当地 社区 非 营利 组 织 互 动 的 课程 ， 并 运用 自己 的 知识 解决 社区 问题 “。 此 外 ， 
卡耐基 梅 隆 发 现 直 接 杂 取 女 性 对 促进 计算 机 领域 的 女性 参与 有 很 强 的 有 影响。 通过 他 们 的 招生 计划 
和 之 前 所 述 的 课程 ， 他 们 计算 机 系 女 大 学 生 的 比例 由 1995 年 7% 增 长 到 至 2000 年 的 40%。 尽 管 2007 
年 全 国 计 算 机 科学 的 入 学 率 总 体 下 降 ， 卡 内 基 梅 隆 是 一 个 例外 ， 该 校 女生 入 学 率 占 到 23%。 











13.2.2 ”跨国 数据 的 意义 


2004 年 ，Charles 和 Bradley 分 析 了 经 济 合作 发 展 组 织 (OECD) 提供 的 21 个 工业 化 国家 高 等 教 
育 学 位 授予 的 数据 。 正 如 预期 的 那样 ， 妇 女 主要 集中 在 传统 的 女性 型 领域 ， 如 健康 和 教育 ， 而 在 
传统 男性 领域 中 落后 ' |。 在 所 有 21 个 国家 中 ， 女 性 在 计算 机 科学 中 的 任职 人 数 偏 低 ( 表 13-1)。 
令 人 惊讶 的 是 , 这 组 数据 包括 了 男女 平等 的 国家 以 及 男女 不 平等 国家 ， 人们 可 能 预期 在 男女 不 平 
等 的 国家 里 ， 女 性 人 数 的 不 足 (或 男性 比例 过 高 ) 将 会 是 最 严重 的 。 然 而 ,土耳其 和 韩国 ， 都 古 
男女 不 平等 的 国家 ， 阳 盛 阴 误 的 情况 却 较 小 〈 见 表 13-1)。 这 可 能 部 分 因为 政策 规定 计算 机 行业 
男女 都 要 参与 的 缘故 。 阳 盛 阴 衰 指 数 表 示 每 个 国家 计算 机 领域 男性 超过 女性 的 倍数 (数据 如 何 得 
出 请 参照 Charles 和 Bradley 的 报告 号]。 





表 13-1 2001 年 ， 计 算 机 科学 专业 中 “ 阳 盛 阴 衰 指数 ” 


家 阳 盛 阴 豪 指数 家 阳 盛 阴 衰 指数 
澳洲 2.86 荷兰 4.39 
奥地利 5.37 新 西 兰 2.92 
比利时 5.58 挪威 2.75 
Ge ot 6.42 斯 洛 伐 克 6.36 
丹麦 5.47 西班牙 3.67 
pee 2.29 瑞典 1.95 
法 国 4.57 瑞士 4.00 
德国 5.58 土耳其 1.79 
匈牙利 4.66 英国 3.10 
爱尔兰 1.84 美国 2.10 
ih E] 1.92 





* 值 表 示 了 每 个 国家 男性 阳 盛 阴 误 指数。 这 个 值 是 之 前 计算 中 计算 机 科学 参数 (参见 第 6 章 中 McGrath Cahoon and 
Aspray, 2006 以 及 Charles 和 Bradley 的 论文 ' 1) 的 倒数 ， 并 且 把 结果 的 正 值 转换 为 指数 形式 。 
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Charles 和 Bradley 的 研究 并 不 符合 社会 进化 理论 ， 因 为 经 济 最 发 达 国 家 计算 机 科学 领域 的 女 
性 并 没有 更 多 。 同 样 ， 作 者 表明 ,在职 女 性 数量 或 者 高 职位 女性 数量 与 学 习 计 算 机 科学 的 数量 并 
没有 很 强 的 相关 性 。 这 些 结果 再 次 表明 ,计算 机 专业 女性 人 数 不 足 的 原因 更 像 是 文化 因素 ， 而 不 
是 生理 因素 ， 而 文化 因素 是 可 以 改变 的 。 但 需要 着 重 注意 的 是 ,人 研究 并 没有 提供 证 据 证 明 ， 经 济 
最 发 达 的 国家 计算 机 科学 中 的 女性 更 多 , 或 是 劳动 力 市 场 、 高 等 教育 或 高 地 位 专业 中 女性 多 的 国 
家 有 更 多 的 女性 在 计算 机 科学 领域 …。 因 此 ,女性 的 偏好 成 为 了 女性 就 职 现象 最 可 能 的 解释 ， 而 
不 是 暗示 性 偏见 阻止 了 女性 进入 计算 机 行业 。 

所 有 21 个 国家 计算 机 科学 女性 人 数 的 不 足 代 表 了 在 这 些 国 家 的 文化 中 有 一 个 强烈 的 信念 , 即 
男性 和 女性 的 分 工 有 所 不 同 。 对 于 Charles 和 Bradley 的 研究 ， 最 有 意思 的 地 方 在 于 ， 国 家 与 国家 
之 间 有 着 很 大 的 差别 ， 这 就 意味 着 社会 文化 因素 的 影响 非常 之 大 。 在 美国 ,我们 强调 教育 的 社会 
目标 是 培育 自由 选择 和 自我 实现 ,然而 主流 社会 的 各 种 成 见 又 可 能 暗中 扼杀 了 学 生 的 “自由 ” 选 
择 ， 因 为 他 们 可 能 会 去 追求 传统 文化 中 应 由 男性 或 女性 担任 的 工作 。Charles 和 Bradley 指 出 ， 政 
府 对 课外 课程 严格 管制 的 国家 《如 韩国 和 爱尔兰 ) 中 ,计算 机 科学 相关 行业 女性 人 数 不 足 的 情况 
较 轻 。 这 表明 ， 我 们 可 能 要 推迟 青少年 的 职业 选择 到 他 们 不 太 会 受 性 别 成 见 所 影响 的 时 候 ， 并 落 
实 各 种 政策 ， 让 学 生 从 幼儿 园 到 12 年 级 以 及 之 后 都 有 机 会 探索 数学 和 科学 ， 包 括 计算 机 科学 。 

















13.3 结论 


在 这 一 蔓 中 , 我 们 提供 了 最 新 的 证 据 ， 和 帮助 读者 训 哆 和 探索 为 什么 很 少 有 女性 从 事 计算 机 职 
业 这 一 问题 ， 为 什么 我 们 应 该 关心 这 个 问题 ， 以 及 如 且 我 们 可 以 为 此 做 些 什么 的 话 ， 该 如 何 做 。 
我 们 提 到 男性 女性 之 间 的 生理 差异 以 及 认 知 能 力 差 异 , 尤其 体现 在 极 具 天 赋 的 个 人 上 ， 在 职业 生 
兰 和 生活 方式 上 的 偏好 差异 ; 以 及 计算 机 科学 环境 文化 。 尽 管 在 理解 性 别 和 CS/IT 领 域 参与 人 数 
的 关系 时 ， 有 明显 的 福 沟 ， 基 于 关于 女性 在 科学 领域 的 实证 文献 ,， 仍 有 必要 讨论 应 不 应 该 政 励 更 
多 女性 参与 CS 领域 并 权衡 其 代价 。 

总 之 ， 庆 业界 和 商业 寞 的 一 些 人 认为 ，CS/IT 相 关 领 域 缺少 女性 是 不 利于 女性 经 济 地 位 和 全 
国 经 济 发 展 的 ， 而 另 一 些 人 持 相 反观 点 。 尽 管 一 些 关 于 CS 领域 女性 数量 不 足 的 跨国 比较 “质疑 
了 干预 措施 的 意义 ， 总 的 来 说 ， 如 末 政 策 制定 者 能 在 学 生年 龄 前 小 ,还 没有 被 性 别 身份 角色 左右 
之 前 , 就 推进 田 女 学 生 接 触 计算 机 , 似乎 会 是 一 个 明智 之 举 。 考虑 到 对 于 女性 和 社会 的 艾 在 好 处 ， 
可 以 考虑 或 励 女 性 进入 信息 技术 、 计 算 机 科学 和 计算 机 工程 领域 的 步骤 。 很 多 研究 者 已 经 丁 出 了 
文化 、 课 程 、 信 心 有 关 的 干预 措施 “， 首 先 需 要 持续 评估 它们 是 否 有 效 ， 能 帮助 还 是 阻碍 
女性 参与 计算 机 科学 领域 ， 以 及 这 些 变化 是 否 真正 地 改善 了 这 个 领域 。 节 终 目 标 应 该 是 计算 机 专 
业 的 质量 、 有 效 性 和 发 展 , 无 论 这 是否 意味 着 CS 未 来 大 部 分 征 男 性 、 女 性 、 或 是 平衡 的 性 别 组 成 。 
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第 14 章 


两 个 关于 编程 语言 的 比较 


Lutz Prechelt 


TERRA, 典型 的 程序 员 们 往往 很 安静 。 不 过 有 那么 一 个 话题 , 他 们 不 仅 会 全 神 贯 注 地 听 ， 
而 且 会 积极 地 参与 到 讨论 中 来 ， 那 征 什 么 话题 呢 ? 编程 语言 ! 每 个 程序 员 都 有 很 多 关于 各 种 编 
程 语言 的 故事 可 说 ， 对 于 哪 种 语言 息 了 最 好 的 以 及 为 什么 ， 也 有 看 目 己 的 许多 看 法 。 有 证 据 文 持 
吗 ? 当然 。 经 验 直 富 的 程序 员 们 还 会 有 许多 的 “实战 故事 "， 来 告诉 人 们 某 种 编程 语言 会 叶 致 事 
情 往 好 或 者 不 好 的 方面 发 展 :“ 我 本 来 估计 这 是 个 十 小 时 或 十 五 小 时 的 活 ， 但 后 来 我 转 用 X 语 言 ， 
把 所 有 的 代码 写 完 让 它 跑 起 来 只 用 了 三 个 小 时 。 而 且 代 码 的 可 读 性 竞 然 也 不 错 1” 

但 这 种 证 据 有 个 问题 ， 它 通 和 不 包括 任何 对 于 编程 语言 的 直接 比较 。 如 东 其 中 存在 比较 的 
话 ， 有 类 似 于 剃 有 与 橘子 之 辐 的 比较 束 算 是 不 错 的 了 ， 大 部 分 情况 下 更 像 是 乎 采 与 猩猩 之 间 的 
比较 。 

人 们 认为 科学 家 们 会 抓 住 这 个 机 会 ， 为 计算 机 编程 领域 做 出 广为人知 的 巨大 页 献 ， 并 且 
会 产 出 一 系列 出 色 而 又 清晰 的 研究 来 比较 各 种 编程 语言 的 优 缺 点 。 有 大 量 课题 可 以 候选 : 〈 语 
言 ) 执行 速度 、 内 存 消耗 、 缺 陷 率 、 人 缺陷 类 型 、 可 靠 性 、 稳 健 性 、 可 读 性 、 可 修改 性 、 编 程 

但 我 也 不 知道 为 什么 , 到 目前 为 止 这 种 情况 从 未 发 生 过 。 这 方面 的 科学 证 据 非 常 不足 。 此 外 ， 
尽管 聚会 中 的 实战 故事 远 比 严肃 的 科学 研究 吸引 人 ， 但 这 些 故事 的 可 信 度 并 不 高 ”。 

在 我 的 职业 生涯 中 , 我 曾 遇 到 过 两 次 机 会 对 编程 语言 进行 合理 的 有 说 服 力 的 比较 , 而 且 我 抓 
住 了 它们 。 本 章 讲 述 的 就 征 这 两 次 研究 的 故事 。 


14.1 一 个 搜索 算法 决定 了 一 种 语言 的 胜出 


我 曾 为 一 项 研究 收集 了 许多 对 同一 程序 的 不 同 代码 实现 , 第 一 个 机 会 就 此 产生 。 那 项 研究 
评估 了 Watts Humphrey 的 个 人 软件 过 程 (PSP™) 的 培训 效果 。PSP 号 称 培训 之 后 ， 能 在 估算 准确 
度 、 缺 陷 密度 和 生产 力 方 面 有 较 大 的 提高 ， 但 我 们 的 研究 发 现 ， 效 末 比 预期 小 很 多 。 

参与 该 项 研究 的 研究 生 中 一 半 接 受 了 PSP 的 培训 ， 其 余 则 接受 了 其 他 编程 相关 的 培训 。 在 该 
项 研究 中 ， 他 们 都 被 要 求解 决 同样 的 任务 (在 下 一 证 中 介绍 )， 但 可 以 自由 地 选择 编程 语言 。 最 
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后 产生 了 40 种 不 同 的 代码 实现 (用 Java 语 言 的 有 24 个 ， 用 C++ 的 有 11 个 ， 用 C 语 言 的 有 5 个 )。 这 
时 我 发 现 如 果 从 三 种 语言 的 角度 来 比较 程序 ,会 比 单纯 比较 是 否 接 受过 PSP 培 训 的 学 员 更 有 意思 ，。 
如 末 可 以 进一步 比较 用 不 同 脚 本 语言 实现 的 程序 ， 那 会 更 有 意思 。 

于 是 ， 我 在 几 个 Usenet 的 新 闻 组 里 面 发 布 了 召集 编程 实现 的 帖子 ( 那 是 1999 年 )， 在 四 周 之 
内 我 就 收 到 了 另外 40 个 编程 志愿 者 们 寄 过 来 的 代码 : 用 Perl 实 现 的 有 13 个 ， 用 Python 的 有 13 个 ， 
FuRexxi 4, FATCLAHYA 10%, 

这 时 ， 你 会 质疑 说 :“ 等 等 ， 你 怎么 知道 这 些 人 的 编程 能 力 有 可 比 性 呢 ? ”很 好 的 问题 ， 我 
们 会 在 最 后 讨论 可 信和 度 时 回 到 这 个 问题 上 来 。 


14.1.1 编程 任务 : 电话 编码 


程序 员 要 实现 下 面 的 程序 。 

程序 首先 加 载 一 个 字典 到 内 存 里 (一 个 纯 文本 文件 ， 每 行 有 一 个 单词 ， 整 个 测试 文件 中 包含 
73 113 个 单词 ， 一 共 938KB)。 接 着 ， 它 从 另 一 个 文件 读 取 “ 电 话 号 码 ”( 由 任意 数字 、 破 折 号 和 
斜 杠 组 成 的 最 天 为 50 个 字符 的 长 字符 串 )， 把 它们 一 个 一 个 转 成 词 序列 ， 并 打印 出 结果 。 字 符 和 
数字 之 间 的 转换 有 预定 义 的 国定 映射 〈 虽 在 平衡 数字 频率 ) ， 如 下 所 示 ; 


e jng rwx dsy ft am civ bku lop ghz 
0 111 222 333 44 55 666 777 888 999 


程序 的 任务 是 要 找到 一 列 词 , 这 些 词 中 的 字符 序列 正好 对 应 电话 号 码 中 的 数字 序列 。 必 须 找 
到 所 有 的 对 应 结 未 ， 并 打印 出 来 。 答 和 案 征 由 一 个 一 个 词组 建 而 成 的 ， 如 采 在 这 个 过 程 中 , 字典 中 
没有 一 个 词 可 以 插入 茶 个 位 置 , 那 束 可 以 用 电话 号 码 中 这 个 位 置 的 数字 插入。 许多 电话 号 码 压根 
设 有 任何 对 应 结 末 。 

这 里 有 一 个 电话 号 码 3586-75 的 例子 。 字 典 里 面 舍 有 Dali, um, Sao, da, 以 及 Pik 这 些 词 。 


3586-75: Dali um 
3586-75: Sao 6 um 
3586-75: da Pik 5 


在 处 理 每 一 个 号 码 的 时 候 , 程序 需要 保存 中 间 转 换 的 结案 。 这 就 需要 程序 把 字典 读 入 一 个 高 
效率 的 数据 结构 中 ， 因 为 这 里 我 们 严 茶 为 每 个 需要 解码 的 数字 扫描 整个 字典 。 

程序 员 必 须 保证 实现 古 百 分 之 一 百 可 靠 的 。 他 们 有 一 份 小 字典 用 来 进行 测试 ,以 及 一 组 输入 
输出 作为 例子 。 输 入 的 是 电话 号 码 ， 输 出 的 是 这 些 号 码 对 于 给 定 字 上 典 的 所 有 正确 译 码 。 


14.1.2 ”比较 执行 速度 


图 14-1 显 示 了 7 种 语言 运行 时 间 的 比较 。( 参 竹下 面 的 “如 何 阅 读 盒 状 图 ”来 理解 盒 状 图 格 
a) 
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处 理 1000 个 输入 的 运行 时 间 ( 单 位 为 秒 ) 


图 14-1 每 种 语言 处 理 1000 个 输入 的 运行 时 间 。 坏 结 末 对 好 结 末 的 比率 从 Tcl 的 1.5 到 
C++ 的 27。 请 注意 ， 数 轴 上 的 数字 是 对 数 增长 的 ， 拿 Java 来 说 ， 运 行 时 间 的 差 
距 可 以 达到 500 倍 


如 何 阅 读 盒 状 图 


盒 状 图 是 一 种 很 好 的 可 视 化 工具 , 它 可 以 用 来 很 快 地 比较 不 同 数据 样本 的 位 置 与 分 
布 情况 。 在 我 们 这 个 金 状 图 中 ， 每 一 个 小 圆圈 表示 一 个 数据 点 。 

盒子 表示 数据 的 “中 间 的 一 半 ”， 即 盒子 的 左边 缘 代 表 了 25 百 分 点 ， 即 25% 的 数据 
点 小 于 或 等 于 这 个 点 (必要 时 会 加 上 插 补 值 ) ;盒子 的 右边 缘 代 表 75 百 分 点 。 

胖 圆 点 表示 50 百 分 点 (中 位 值 )。 为 了 跟 中 位 值 区 别 开 来 ,平均 数 用 字母 M 标 明 。 
M 周 围 的 虚线 代表 着 平均 值 加 减 一 个 标准 误差 之 后 的 范围 ， 这 表明 在 当前 样本 中 ， 人们 
在 68% 的 置信 度 下 估计 总 体 平均 值 的 准确 度 。 

盒子 左右 的 短 坚 线 分 别 表 示 10% 和 90% 的 分 界 点 ， 比 用 最 大 最 小 数 更 好 地 表示 了 极 
值 。 盒 子 很 宽 或 者 虚线 很 长 意味 着 数据 的 变动 性 很 高 ， 也 就 是 说 不 确定 性 很 大 ， 而 对 于 
软件 开发 来 说 ， 就 是 高 风险 的 意思 。 我 们 用 金子 右边 缘 比 左边 缘 的 比率 来 衡量 变动 性 ， 
叫做 好 坏 比 率 ， 或 者 坏 好 比率 。 左 边缘 是 数据 下 半 部 分 的 中 值 ， 如 果 数 据 是 记录 消耗 的 
话 ， 那 下 半 部 分 是 “好 ”的 数据 ， 因 为 消耗 总 是 越 少 越 好 。 上 半 部 分 同样 如 此 。 

当 用 可 视 化 比较 编程 语言 时 ， 我 们 可 能 会 比较 胖 圆 点 和 M 点 (平均 值 ) 的 位 置 ， 或 
整个 盒子。 金子 的 形态 能 最 明显 地 表现 出 不 确定 性 ,这 降低 了 我 们 得 出 仓促 结论 的 可 能 。 

比 可 视 化 比较 工具 更 可 靠 (但 从 明显 ) 的 比较 手段 是 基于 统计 的 数值 比较 。 在 目前 
情况 下 ， 可 以 通过 随机 引导 方式 计算 置信 区 间 。 请 注意 ,有 时 数据 相差 十 分 大 ， 图 上 需 
要 使 用 对 数 刻度 ， 这 会 阻碍 你 的 想象 力 。 想 想 清楚 吧 | 

此 外 ，C 语 言 和 RexX 语 言 的 图 有 点 不 可 靠 ， 因 为 它们 分 别 只 有 四 五 个 实现 。 
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记 住 ， 这 些 数 据 是 对 数 刻 度 的 ， 这 意味 着 图 中 同 语言 内 的 差异 是 巨大 的 。 它 大 到 21 个 语言 : 
均 运 行 时 间 的 成 对 差异 中 , 没有 一 个 具有 统计 显著 性 。 这 点 可 以 从 图 中 每 种 语言 的 虚线 都 高 度 重 
登 看 出 。 这 意味 着 不 能 忽视 这 种 可 能 性 (显然 超过 5%， 即 统计 显 车 性 的 临界 点 ): 观察 到 的 差异 
可 能 仅仅 是 因为 随机 波动 造成 的 ， 因 此 是 不 “真实 ”的 。 

换 句 话说 , 我 们 可 以 说 程序 员 之 间 的 差异 大 于 语言 之 间 的 差异 。 有 一 些 运行 时 间 中 位 数 的 明 
显 差异 (Perl 和 Python 都 比 Rexx 和 Tcl 更 快 )， 但 中 位 数 并 不 很 相关 ， 因 为 你 只 有 在 关心 一 个 程序 
是 否 比 男 一 种 更 快 而 不 是 快 多 少 的 时 候 才 会 使 用 它 。 

为 了 从 数据 中 得 出 更 多 信息 ， 我 们 把 语言 分 为 三 组 : Java 一 组 ，C 和 C++ 一 组 ， 所 有 四 个 脚 
本 语言 一 组 。 在 这 种 分 类 下 , 统计 分 析 表 明 , 在 80% 的 置信 和 度 下 , 脚本 程序 运行 时 间 至 少 是 C/C++ 
程序 的 1.29 倍 ，Java 程 序 运 行 时 间 至 少 是 C / C++ 的 1.22 倍 。 这 没什么 大 不 了 的 。 这 时 我 会 听 到 你 
说 :“ 我 不 相信 ! C 和 C++ 远 远 要 比 脚 本 语言 快 无 数 倍 。 这 些 差异 到 底 跑 到 哪里 去 了 ? ” 

这 个 问题 有 两 个 答案 。 首 先 我 们 把 运行 时 间 分 为 两 部 分 。 该 电话 编码 程序 执行 有 两 个 阶段 : 
第 一 ， 加 载 字 典 和 建立 相应 的 数据 结构 ， 二、 对 于 每 个 输入 的 号 码 执行 搜索 。 在 搜索 阶段 ， 脚 本 
语言 的 内 部 差距 相当 大 ，Java 的 内 部 差距 非常 大 ， 而 C/C++ 的 内 部 差距 则 巨大 无 比 。 编 程 语言 
部 的 差别 是 如 此 之 大 ,以 至 于 语言 之 间 呈 现 的 差异 在 统计 意义 上 变 得 微不足道 。 不 过 ， 在 加 载 字 
典 阶段 ，C / C++ 程序 确实 是 最 快 的 。Java 程 序 至 少 需要 平均 1.3 倍 的 时 间 才 能 完成 ， 而 脚本 程序 
至 少 需要 平均 4.5 倍 的 时 间 (80% 的 置信 度 )。 

第 二 个 答案 在 于 编程 语言 内 的 差距 ， 这 是 令 人 难以 置信 的 ， 特 别 是 对 C 和 C++ 而 言 。 这 很 大 
程度 上 模糊 了 语言 间 的 差异 。 还 记得 之 前 提 过 的 好 坏 比 率 么 : C++ 程序 中 较 慢 一 半 运 行 时 间 的 中 
位 值 是 较 快 一 半 中 位 值 的 27 倍 。 难 道 开 发 较 慢 一 半 的 程序 员 都 是 大 和 白痴? 不， 他们 不 是 。 下 面 关 
于 程序 结构 的 讨论 会 揭 开 到 底 这 些 差 异 是 从 哪里 来 的 。 


14.1.3 ”内 存 使 用 情况 的 比较 


与 上 一 市 中 运行 的 程序 相同 ， 图 14-2 显 示 了 不 同 语言 实现 的 内 存 使 用 情况 比较 。 
从 图 中 ， 我 们 观察 到 

O 稍 小 的 C/C++ 程序 内 存 消 耗 最 低 ; 

O C++ 和 Java 明 显 分 成 两 个 小 团体 (看 小 圈 )， 消 耗 大 的 与 消耗 小 的 ， 

O 脚本 语言 往往 不 如 C / C++, 

O Java 语 言 平均 来 说 明显 比 其 他 语言 都 差 ， 

O 对 于 内 存 使 用 来 说 ， 用 哪 种 语言 都 可 能 让 你 吃 不 了 包 着 走 ; 

O Java 的 差异 性 最 大 ， 所 以 计划 风险 最 大 。 

接 下 来 的 分 析 里 面 ， 我 们 会 讨论 把 程序 分 段 的 必要 性 。 


14.1.4 ”比较 效率 和 代码 长 度 
在 千 兆 内 存 和 千 兆 赫 效 、 多 核 CPU 的 时 代 ， 运 行 时 间 和 内 存 销 耗 往往 并 不 重要 。 但 是 ， 如 何 
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图 14-2 ”处 理 1000 个 输入 时 的 内 存 使 用 情况 ， 包 括 运 行 中 的 系统 、 程 序 代码 和 数据 合 
用 情况 。 坏 好 比率 从 Python 的 1.2 到 C++ 的 4.9 不 等 
我 们 看 到 ， 脚 本 语言 平均 用 时 差不多 3 至 5 个 小 时 ， 非 脚本 语言 却 用 时 9 至 16 小 时 。 非 脚本 语 
言 大 概 征 脚本 语言 的 三 倍 。 我 几乎 可 以 看 到 所 有 非 脚 本 语言 的 程序 员 都 在 座位 上 情 情 不 安 。 这 些 
数据 可 信 吗 ? 或 者 有 许多 脚本 语言 程序 员 诉 报 了 他 们 的 工作 时 间 ? 图 14-4 提 供 的 证 据 表 明 ,， 数据 
是 可 信 的 ， 因 为 脚本 程序 长 度 是 非 脚 本 程序 的 三 分 之 一 。 不 过 ， 解 释 这 些 数据 时 ， 请 参阅 14.1.7 
节 的 注意 事项 。 
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程序 员 的 所 有 工作 时 间 (单位 为 小 时 ) 


图 14-3 程序 员 的 所 有 工作 时 间 。 脚 本 语言 的 数据 由 程序 员 上 自己 测量 和 汇报 ， 非 脚本 
语言 的 数据 由 实验 者 测量 。 坏 好 比率 范围 从 C 的 3.2 到 Perl 的 1.5。 有 3 个 分 别 是 
40，49 和 63 小 时 的 Java 程 序 工作 时 间 ， 在 这 里 没有 显示 
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程序 长 度 ( 非 注释 的 源 代 码 ) 


图 14-4 ”程序 长 度 ， 非 注释 的 源 代码 行 数 。 坏 好 比率 放 围 从 C 的 1.3 到 Java 的 2.1 和 Rexx 





的 3.7。 脚 本 语言 的 评论 密度 (未 显示 ) 比 非 脚本 语言 的 高 


14.1.5 ”比较 可 靠 性 


在 对 所 有 程序 的 可 靠 性 测试 中 , 我 们 发 现 大 部 分 程序 表现 完美 。 一 些 为 数 不 多 的 错误 在 每 种 
语言 都 有 ， 至 少 在 考虑 脚本 语言 程序 员 和 非 脚本 语言 程序 员 不 同 的 工作 条 件 时 “。 此 外 ， 在 所 有 
语言 中 某 种 输入 都 容易 出 错 : RARI Ss AR ine AE CHT SHS”, EZ, KE 
有 发 现 语言 间 表 现 出 的 一 贯 的 可 知性 差异 。 


14.1.6 ”比较 程序 结构 


当 我 们 次 入 程序 的 狐 代 码 想 要 得 看 它们 的 设计 时 , 我 们 发 现 了 这 个 实验 的 第 二 个 真正 精彩 的 
ZH 0 
程序 中 使 用 了 三 种 基本 数据 结构 中 的 一 种 来 表现 词典 内 容 ， 以 加 快 搜索 。 
O 根据 第 一 个 字母 对 应 的 数字 ， 把 词典 简单 划分 为 10 个 子 群 。 这 是 一 个 简单 但 也 非常 低 效 
的 解决 方案 。 
O 一 个 用 电话 号 码 作为 索引 的 关联 数组 〈 哈 希 表 ) ， 映 射 到 词典 里 面 所 有 对 应 的 词 。 这 个 方 
案 编程 上 没有 增加 难度 ， 但 非常 有 效 。 
口 一 个 10 元 树 ， 其 上 任何 路 径 对 应 一 个 数字 序列 ， 词 典 单词 位 于 所 有 时 列 点 和 一 些 内 部 证 
rho AGG RK, (BERRIRIK, 
观察 结果 很 有 意思 : 第 一 ， 所 有 的 C，C++ 和 Java 程 序 用 了 算法 1 或 算法 3 ， 这 两 种 方案 之 间 
的 差异 解释 了 图 14-1 中 这 三 种 语言 巨大 的 语言 内 差异 ， 第 二 ， 所 有 的 脚本 都 使 用 算法 2。 
算法 2 可 以 说 是 最 好 的 解决 办 法 ， 因 为 它 代码 工作 量 小 ,效率 相当 高 。 但 是 ， 尽 管 C++ 和 Java 
本 身 提 供 了 合适 的 哈 希 映射 实现 ， 但 C++ 和 Java 的 程序 员 显然 没有 想到 使 用 它们 。 相 比 之 下 ， 脚 
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本 语言 程序 员 似 乎 习惯 用 哈 希 表 ， 所 以 他 们 都 想 出 了 相应 简单 和 紧 竣 的 搜索 方法 。 

使 用 的 语言 塑造 了 程序 员 的 思维 , 尽管 他 们 中 的 许多 人 也 了 解 其 他 类 型 的 语言 。 这 个 结 东 也 
解释 了 有 关 语 言 则 程序 长 度 的 差异 : 使 用 关联 数组 的 循环 代码 量 少 。 

我 不 认为 这 些 结 东 和 语言 的 “好 或 “ 差 ， 相关 。 特 定 的 语言 使 得 程序 员 倾 问 于 特定 的 解决 
方案 风格 。 哪 个 更 好 取决 于 手头 的 具体 问题 。 


14.1.7 ”我 可 以 相信 吗 
请 记 住 ， 这 里 我 们 仍然 有 一 个 挥 之 不 去 的 问题 : 
我 们 怎么 知道 ， 我 们 比较 的 这 些 不 同 语言 的 程序 员 们 编程 水 平 相当 ? 


我 们 可 以 用 上 一 市 中 所 使 用 的 比较 工作 效率 的 方法 : 比较 每 小 时 产 出 的 代码 行 数 。 众 所 周知 ， 
每 行 代码 的 工作 量 取决 于 程序 需求 和 各 种 制约 因素 ， 但 几乎 跟 编程 语言 没有 关系 ， 因 此 较 高 的 语 
言 表 述 能 力 是 提高 生产 力 的 产 凡 。 因 此 ,如 有 朱 语 言 间 每 小 时 代码 行 数 都 差不多 的 话 ,， 我们 有 理由 相 
ay 每 种 语言 的 程序 员 们 是 可 以 互相 比较 的 (大 不 了 会 有 少数 脚本 程序 员 的 工作 速度 快 得 过 分 了 )。 

如 图 14-5$ 所 示 ， 结 采 中 顶 多 有 四 个 效率 值 高 得 离谱 〈ITCL 三 个 ，Perl 一 个 ) ， 其 他 所 有 都 落 在 
PSP 实 蛤 中 被 监控 的 Java、C 和 C++ 程序 员 们 的 数据 邯 围 之 内 ， 所 有 语言 的 平均 数 都 比较 相似 。 这 
意味 着 它们 可 以 相互 比较 ， 脚 本 语言 程序 员 报 告 的 工作 时 间 也 是 大 致 正确 的 。 
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编程 工作 效率 :每 小 时 非 注释 代码 行 数 


图 14-5 ”编程 工作 效率 : 每 工作 小 时 非 注 释 行 代码 的 行 数 。C、C++ 和 Java 工 作 时 间 古 








被 记录 下 来 的 ， 脚 本 语言 的 工作 时 间 是 程序 员 自 己 上 报 的 


接 下 来 ， 如 采 我 们 同意 接受 以 上 的 结论 ， 当 我 们 解释 这 些 数据 时 ， 仍 有 三 条 限制 条 件 需要 我 
(Med. 

O 这 些 度量 比较 旧 (在 1999 年 完成 )。 现 在 每 种 语言 或 多 或 少 都 进行 了 优化 ， 重 新 来 做 实验 

的 话 可 能 会 不 同 。 特 别 是 Java (当时 的 版 本 1.2) 和 Python (当时 版 本 1.5) 应 该 已 经 提高 
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TIRE. 此 外 , 在 数据 采集 时 , Java 还 是 一 门 很 新 的 语言 , 程序 员 们 对 它 的 掌握 度 还 不 高 。 
例如 ， 有 的 程序 员 没 有 用 StringBuffers 而 是 用 了 Strings 了 ， 这 人 解释 了 Java 程 序 中 内 存 
消耗 、 运 行 时 间 中 一 些 不 理想 的 数据 。 

O 本 研究 的 代码 任务 小 ， 而 且 相 当 具 体 。 其 本 质 也 相当 特殊 。 不 同 的 任务 可 能 会 带 来 不 
的 结果 ， 但 我 们 不 能 确定 。 

口 脚本 程序 员 的 工作 条 件 与 Java、C 和 C++ 组 的 不 一 样 。 后 者 是 在 实验 室 条 件 下 ， 而 前 者 在 
非 实验 条 件 下 。 特 别 是 一 些 脚本 程序 员 报 告 说 ， 他 们 并 没有 在 读 了 任务 说 明之 后 马上 开 
写 代码 ， 这 意味 着 他 们 可 能 有 更 多 的 时 间 进 行 思 邦 ,但 这 没有 在 时 间 测 量 内 体现 出 来 ， 
这 是 一 个 优势 。 幸 运 的 是 ， 在 工作 时 间 的 差异 是 巨大 的 ， 就 算是 非 脚 本 语言 的 工作 时 间 
打 个 很 大 的 折扣 ， 剩 下 的 差异 仍旧 很 大 。 

其 他 一 些 因 素 也 可 能 影响 本 研究 的 结果 。 如 果 你 想 了 解 ， 可 以 去 看 这 个 研究 的 原始 数据 "|。 

也 有 一 个 短 些 的 报告 趾 ， 但 仍 比 在 这 里 描述 得 详细 些 。 


14.2 Plat_Forms: 网 络 开 发 技术 和 文化 


第 二 个 比较 语言 的 机 会 是 这 样 产 生 的 : 2005 年 一 家 网 络 应 用 软件 服务 公司 的 所 有 者 Gaylord 
Aulke 打 电话 给 我 ， 他 说 他 读 了 我 那 篇 关于 “电话 编码 ”的 报告 ， 然 后 解释 给 他 的 客户 听 为 什么 
不 必 慢 怕 使 用 脚本 语言 。 但 他 想 要 一 些 更 具体 的 东西 ， 于 是 问 我 是 不 古 可 以 为 PHP 也 做 个 类 似 的 
实验 呢 ? 

听 上 去 很 有 意思 ， 但 我 起 了 两 秒 钟 后 就 对 他 说 我 做 不 了 ， 并 解释 了 原因 : 首先 ， 为 了 可 信 ， 
比较 网 页 开发 平台 需要 一 个 更 大 任务 (至 少 需 要 儿 天 时 间 来 做 一 个 看 得 到 的 网 络 应 用 );， 需要 团 
队 (至 少 三 个 人 ,这样 我 们 才能 研究 Web 开 发 的 各 个 方面 )， 而 不 是 像 语言 组 里 面 一 个 人 完成 一 
个 程序 ; 需要 高 质量 的 专业 选手 ， 而 不 是 随机 的 人 员 或 是 学 生 《〈 网 络 开发 平台 的 实际 运用 需要 更 
深入 的 知识 )。 同 时 ， 评 佑 方法 会 更 加 复杂 。 我 想 不 出 来 有 谁 会 给 如 此 庞大 的 实验 买单 。 

他 的 反应 古 “ 咽 ,我 了 解 了 。 我 会 找 些 人 ， 也 许 我 们 可 以 做 些 什 么 。 几 个 月 后 ， 在 他 的 努 
力 下 ， 我 与 Richard Seibt 和 Eduard Heilmayr 取 得 了 联系 ， 这 两 个 人 最 终 吸 51 了 很 多 团队 加 入 到 这 
个 实验 中 来 。 我 把 这 个 实验 计划 缩减 了 相当 一 部 分 ， 命 名 为 Plat Forms。 这 个 实验 的 目的 是 为 了 
寻找 在 平台 内 一 致 、 而 在 平台 间 不 同 的 解决 方 条 或 者 开发 流程 中 的 一 部 分 或 所 有 特 后 。 这些 特 所 
被 认为 是 平台 的 突出 特 操 ,也 就 古 说 ,在 设计 或 决定 采用 平台 时 没 用 处 到 ,但 却 对 开发 造成 了 
一 员 影 啊 的 因素 。 

除了 没有 足够 的 团队 做 .Net，Python 和 Ruby 的 开发 之 外 ， 在 苋 赛 的 名 义 下 采集 数据 很 顺利 ， 
我 们 只 有 Java, Perl 和 PHP 的 。 评 佑 过 程 很 困难 ， 不 过 好 终 我 们 也 发 现 了 有 趣 的 结 朱 。 


14.2.1 FATES: AURR 


在 2007 年 1 月 25 日 上 午 , 九 支 过 硬 的 专业 队伍 (三 支 使 用 Java,， 三 支 使 用 Perl,， 三 文 使 用 PHP ) 
分 别 拿 到 了 20 页 文件 〈 详 细 描 述 了 127 个 详细 的 功能 需求 ，19 个 非 功能 需求 ，5 个 组 织 需求 ) 和 光 
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盘 上 的 两 个 数据 文件 。 第 二 天 下 午 ， 他 们 递交 了 一 张 DVD, 包含 源 代 码 、 版 本 压缩 包 、 以 及 包含 
可 以 运行 解决 方案 的 VMware 虚拟 机 。 在 此 期 间 ， 他 们 可 以 以 任何 适合 他 们 的 风格 工作 EB 
括 通过 公共 原型 服务 背 和 博客 评论 进行 现场 测试 )， 使 用 一 切 可 用 的 软件 和 他 们 需要 的 工具 。 

功能 需求 以 用 户 用 例 的 格式 表示 ， 并 且 标 有 优先 级 (一定 要 做 ， 应 该 做 ， 可 以 做 )。 功 能 需 
求 描述 的 是 一 个 社区 门户 网 站 ， 叫 做 “人 以 类 聚 ”〈PbT) 。 程 序 需要 做 到 以 下 几 个 方面 。 

(1) 用 户 注册 ， 其 中 包括 不 稍 见 的 属性 ， 如 GPS 坐标 。 

(2) “简单 的 气质 测试 ”〈(TTT) ， 一 份 包含 40 个 二 选 一 问题 的 问卷 《由 光盘 上 的 一 个 结构 化 文 
本 文件 提供 )， 得 出 一 个 人 格 类 型 的 四 维 分 类 。 

(3) 搜索 用 户 ， 基 于 17 个 不 同 的 搜索 条 件 (可 互相 组 合 )， 其 中 一 些 比较 复杂 ， 比 如 选择 16 个 
个 性 类 型 的 子 集 ， 或 基于 GPS 坐标 做 粗略 的 距离 分 类 。 

(4) 一 个 用 户 列 表 ， 用 于 表示 搜索 结果 ， 或 者 “与 我 有 联系 ”的 用 户 群 等 。 其 中 包括 列表 的 
可 视 化 概要 ， 需 要 用 符号 将 用 户 在 一 个 基于 两 个 可 选 的 笛 卡 儿 坐 标 系 中 表示 出 来 。 

(5) 用 户 状 态 页 面 ， 显示 有 关 用 户 的 详细 资料 (一 些 属性 只 在 一 定 条 件 下 可 见 )。 完 成 一 项 协 
i, 使 用 户 能 够 通过 发 送 和 回答 “获取 联系 详情 ”的 请 求 (RCDs), 使 他 们 的 电子 邮件 对 对 方 可 
见 (“取得 联系 ”)。 

(6) 另外 提供 一 个 基于 SOAP 的 Web 服 务 接口 ， 要 对 应 CD 中 WSDL 文 件 。 

韭 功 能 性 需求 包括 可 扩展 性 、 持 久 性 、 编 程 风格 、 一 些 用 户 界 面 的 特点 ， 等 等 。 

参与 者 可 以 要 求 姜 请 问题 , 但 最 终 每 组 在 每 小 时 中 间 了 不 到 两 次 。 这 项 任务 被 证 明 是 比较 有 
趣 且 比较 适合 作对 比 的 ， 但 对 给 定 的 时 间 而 言 ， 任 务 量 有 点 大 。 


14.2.2 ME 


作为 科学 家 ， 我 对 于 实验 会 发 现 什么 完全 没有 想法 ， 对 于 三 个 平台 的 特点 也 没有 偏见 。 你 相 
信 吗 ? 可 笑 至 极 ! 我 确实 是 中 立 的 (在 并 非 强 烈 支 持 某 一 种 的 意义 上 )， 但 是 我 理所当然 会 有 一 
些 期 望 。 如 采 许 多 期 符 都 被 粉碎 的 话 ， 也 是 充 往 了 娱乐 性 和 局 发 性 的 。 为 了 在 这 章 币 结束 之 前 获 
得 最 大 的 乐趣 和 知识 ， 我 鼓励 你 也 想 一 下 你 有 哪些 期 待 。 就 现在 。 我 是 认真 的 。 

下 面 是 我 的 大 致 预测 。 

e HUUL 

PHP 和 Perl 较 高 。 
eHOUUUU 
Per 最 少 ，PHP 较 低 ，Java 最 高 。 
e HUUL 
Java 最 快 。 
e OUL 
Java 最 好 ，PHP 最 差 。 
e HUUL 
Java 的 干净 ，Perl 和 PHP 实 际 〈 别 管 这 意味 着 ， 我 自己 也 不 确定 )。 
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eHUUU 
Java 较 少 使 用 增 量 开发 ， 较 多 使 用 前 期 设计 。 
这 些 期 望 中 的 一 部 分 或 多 或 少 地 成 真 了 ， 但 其 他 的 却 大 大 出 乎 意料 。 


14.2.3 ”比较 工作 效率 


由 于 所 有 的 团队 的 工作 时 间 是 一 样 的 《两 天 )， 并 且 依 照 同 样 一 套 细 粒度 的 需求 工作 ， 而 且 


设 有 一 支 团 队 提 前 完成 ， 我 们 通过 计算 有 多 少 需 求 被 实现 旦 可 用 计算 工作 效率 。 结 果 显 示 在 图 
14-6, 





一 定 要 做 
应 用 做 
可 以 做 
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图 14-6 ”在 规定 时 间 内 ， 每 组 完成 的 需求 的 数目 ， 以 优先 级 区 分 
(一 定 要 做 的 ， 重 要 的 ， 可 选 ) 
请 注意 ， 第 9 组 应 该 在 这 次 评估 中 被 忽略 。 他 们 在 初期 测试 版 上 用 了 一 个 不 成 熟 的 框架 ， 其 
局 限 性 使 得 他 们 完成 不 了 多 少 。 他 们 之 前 就 非常 不 愿意 参加 ,但 我 们 不 得 不 激励 他 们 ， 因 为 我 们 
没有 其 他 选择 作为 党 三 个 Java 团 队 了 。 第 4 组 花 了 很 多 时 间 在 VMware 安 装 上 和 耐 ， 与 Java 没 有 任何 
关系 。 尽 管 如 此 ， 该 数据 仍然 包含 了 如 下 有 趣 的 内 容 。 
口 最 有 效率 的 团队 恰恰 来 自 最 不 被 看 好 的 Java 平 台 。 我 们 只 好 猜测 一 下 为 什么 会 如 此 。 一 些 
非 第 3 组 的 参与 者 指出 只 有 第 3 组 用 了 商用 的 框架 。 也 许 正 是 这 个 区 别 解释 了 这 组 的 最 高 


工作 效率 ， 又 或 许 是 因为 这 个 团队 有 民 好 的 “公司 风格 ， 所 以 对 所 用 的 框架 最 为 精通 。 
口 PHP 具 有 最 高 的 平均 工作 效率 。 
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O PHP 也 具有 最 均匀 的 工作 效率 。 如 采 这 是 一 个 系统 效应 的 话 ， 这 将 意味 着 PHP 项 目 〈 至 少 
对 能 力 相当 的 团队 来 说 ) 是 最 低 风 险 的 。 
对 于 最 后 一 项 发 现 , 我 从 来 都 没有 想到 过 , 但 它 显然 需要 进一步 研究 ， 因 为 风险 是 一 项 非常 


重要 的 项 目 特征 "。 现 在 回想 起 来 ， 我 会 期 望 有 较 高 规范 的 静态 语言 比 动态 语言 有 更 平稳 的 工作 
效率 (统计 意义 上 )。 











14.2.4 ”比较 软件 工件 的 大 小 


虽然 各 组 项 目 实现 的 需求 数量 差别 很 大 , 但 这 与 他 们 源 代码 的 大 小 差异 相 比 握 不 了 什么 。 图 
14-7 描 述 了 每 组 提交 的 软件 大 小 (代码 行 数 ) 的 大 概 情 况 ， 只 有 程序 源 代 码 和 模板 文件 被 算 在 内 
(不 包括 数据 文件 ， 二 进 制 文件 ， 编 译文 件 或 项 目 文档 ) 。 





fae) 
S 
© 
Lo) 


Perl 5 
PHP 7 
PHP 8 


图 14-7 工件 大 小 是 指 每 个 团队 的 源 代码 行 数 (SLOC)， 由 文件 来 源 分 为 : 重用 然后 修 


改 (RM), 重用 (R), 手动 编写 (M), 自动 生成 然后 修改 (GM)，, 自动 生成 


(G) 。 请 注意 ，Java 3 组 的 数据 超过 80 000 (几乎 没有 重用 然后 修改 的 代码 )， 
超过 其 他 组 10~20 倍 





这 里 我 们 又 观察 到 一 些 有 意思 的 事情 : 
口 有 些 团 队 修改 了 重用 或 者 自动 生成 的 代码 ， 有 些 没有 ， 跟 平台 关系 不 大 ， 
口 Perl 自 动 生成 的 代码 最 多 ， 
口 重用 代码 的 数量 差别 很 大 ， 但 看 上 去 跟 平台 没什么 关系 ， 14 
O 第 三 组 的 商用 框架 最 为 庞大 。 
虽然 这 从 学 术 上 看 来 很 有 趣 ， 但 他 们 几乎 没有 多 大 实际 意义 。 图 14-8 应 该 能 更 好 地 满足 一 位 
务实 者 的 好 奇 心 ， 这 里 只 考虑 了 手动 编写 的 文件 ， 把 它们 的 大 小 与 实现 的 需求 做 比较 。 
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40 60 80 100 
所 实现 的 需求 数 


0 20 


图 14-8 ”基于 所 实现 的 需求 数 (如 图 14-6 所 示 ) 的 手动 编写 文件 总 长 度 (如 图 14-7 所 示 ) 


这 个 数据 表明 了 我 的 初始 预期 至 少 有 一 项 是 正确 的 : Java 项 目的 大 小 大 于 平均 值 (在 趋势 线 
上 )，Perl 的 大 小 小 于 平均 值 (在 趋势 线 下 )。 


14.2.5 ”比较 可 修改 性 


我 们 关注 工件 大 小 的 原因 一 般 有 两 个 。 首 先 ， 它 可 以 用 来 衡量 投入 的 精力 : 大 型 软件 往往 需 
要 更 长 的 时 间 来 开发 。 但 之 前 的 工作 效率 数据 癌 我 们 表明 ， 这 个 规则 在 使 用 的 时 候 要 有 所 保留 。 
其 次 , 工件 的 大 小 可 以 用 来 衡量 可 修改 性 : 大 工件 往往 需要 更 多 的 精力 去 修改 。 在 我 们 的 实验 中 ， 
又 是 如 何 的 呢 ? 

可 修改 性 由 其 他 两 个 “性 质 ” 所 决定 : 可 理解 性 (我 需要 多 久 找 出 哪里 需要 改动 ， 如何 改动 ) 
和 模块 化 性 (修改 是 针对 这 个 产品 的 一 个 部 分 ， 还 是 到 处 都 有 ? )。 自 20 世 纪 70 年 代 以 来 ， 人 研究 
人 员 一 直 在 寻找 各 种 方法 来 量化 这 些 属性 ， 但 迄今 为 止 的 所 有 建议 都 不 很 邻 人 满意 ”“。 因 此 , 在 
这 里 我 们 根据 我 们 所 提出 的 两 个 简单 的 修改 需求 来 进行 研究 。 

O 在 用 户 注册 时 ， 新 增 一 个 文本 框 表 示 用 户 的 中 间 名 字 的 首 字母 ， 在 用 户 模型 中 处 理 这 个 

数据 。 用 户 界 面 、 程 序 逻 辑 、 用 户 数 据 结构 和 数据 库 需 要 什么 样 的 变化 ? 

O 在 TIT 问 卷 中 添加 一 个 问题 及 其 评估 。 

对 于 每 一 个 场景 ， 我 们 为 每 个 方案 都 列 出 了 在 哪些 文件 中 需要 做 何 种 修改 。 

对 于 第 一 种 情况 ，Perl 以 需要 修改 的 地 方 最 少 而 胜出 ，Java 和 PHP 需 要 作出 更 多 的 变化 ， 有 
些 修 改 并 不 是 那么 显而易见 。 

对 于 第 二 种 情况 ，Perl 1，Perl 5，PHP 7，PHP 8 都 为 TTT 回 卷 的 文本 文件 写 了 一 个 解释 器 ， 
所 以 他 们 所 要 做 的 只 是 添加 一 个 问题 到 文件 里 面 去 ， 十 分 整洁 ! Java9 组 开始 也 随 着 这 个 方向 努 
力 ， 但 没有 完成 。 其 他 团队 的 方法 都 不 太 直 接 ， 比 如 使 用 属性 文件 (Java 3 和 Java 4 组 )， 或 源 代 
码 中 硬 编 码 数组 (PHP 6 组 ) ， 或 数据 库 表 (Perl 2 组 )。 所 有 这 些 都 是 更 难以 改变 的 ， 需 要 不 止 一 
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个 地 方 的 修改 。 

这 些 实验 市 来 了 很 多 混合 的 信息 , 不 过 我 们 认为 它们 意味 着 用 动态 语言 的 程序 员 更 倾 问 于 用 
即兴 的 方法 解决 问题 (相对 于 标准 化 )。 如 采 有 正确 的 设计 思想 (如 团队 1，5，7，8)， 可 修改 性 
会 变 得 更 好 。 

顺便 说 一 下 ,国际 化 很 明确 不 是 一 个 要 求 , 但 可 以 轻松 完成 ， 即 使 使 用 了 解释 强 的 方法 。 在 
采用 属性 文件 方法 前 ，Java 3 队 和 Java 4 队 (以 及 Perl IBA) 曾 询问 是 否 允 许 “ 客 户 ” 在 运行 时 动 
人 态 修 改 调查 问卷 ， 给 他 们 的 答案 是 “不 ”。 

至 于 我 一 开始 对 于 Java 有 着 “和 干 委 ”的 构 染 设计 ， 而 Perl 和 PHP 有 着 “务实 ” 构 染 鸭 期 望 ， 
我 个 人 的 结论 是 , 至 少 在 我 们 要 求 完成 的 系统 中 , 我 们 的 研究 设 有 发 现 Java 具 有 干涩 的 构架 设计 
(或 其 他 好 处 )。 但 Pen 的 构架 的 确 很 务实 ， 也 很 好 用 。 


14.2.6 ”比较 稳健 性 和 安全 性 


最 后 这 个 部 分 的 结果 相对 比较 壮观 (至 少 在 我 看 来 )， 涉及 输入 验证 、 错 误 检 查 和 安全 性 的 
有 关 问 题 。 对 于 九 个 外 部 (完成 需求 的 数量 和 表现 ) 和 内 部 (构架 设计 和 技术 ) 都 不 同 的 系统 来 
说 ,很 难 有 一 个 十 分 公平 的 安全 性 评估 。 我 们 最 终 像 可 修改 性 测试 中 的 一 样 ， 设计 了 一 些 测 试 场 
a, 并 不 指望 涂 透 到 程序 内 部 , 而 只 希望 收集 六 在 安全 漏洞 的 症状 。 我 们 用 纯粹 的 丸 盒 测试 方法 ， 
仅 在 用 户 界 面 做 些 不 友好 的 输入 : 输入 包括 HTML 标 记 、SQL 语 句 、 汉 字 、 超 长 字符， 等 等 。 攻 
14-9 显 示 了 结 有 末 。 在 X 轴 的 项 包含 : 
< 
HIML 标 记 
long 
十 分 长 的 输入 
int’! 
Sbith J EPGIE FF, | E8bitH unicode: $f 
email 
不 正确 的 邮箱 地 址 
SQL 
数据 和 文本 输入 框 中 输入 SQL 语句 
cookie 


Hírt, #ECookie k FH 





系统 的 反应 被 分 为 : 正确 OK， 可 接受 (OK), iR (1), ZEHA (111)。 
总 结 一 下 我 们 的 发 现 : 


e 上 [HIMLU CSS 
两 个 PHP 的 项 目 和 一 个 Perl 项 目 看 上 去 不 太 对 。Java 4 的 项 目 对 这 个 测试 没有 输出 。 另 两 
个 Java 团 队 的 实现 正确 。 
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e OU SQLy O 
所 有 三 个 Perl 的 实现 与 一 个 Java 实 现 都 会 在 恶意 用 户 输 入 的 情况 下 返回 SQRL 异 第 ， 并 不 
确定 这 是 否 代表 了 一 个 实际 的 汤 洞 。 PHP 的 实现 都 正确 。 
* WU 
Perl2 队 出 错 了 ， 其 他 队伍 表现 邦 可 接受 。 
Se 
Perl 2 和 Java 3 都 以 “输入 过 长 ” 拒绝 很 得 的 中 文 输入 ，PHP 的 实现 都 正确 。 
* OU OAU U 


两 个 Java 的 实现 与 两 个 Perl 的 实现 都 没有 地 址 校 验 ， 所 有 的 PHP 实 现 都 完成 了 地 址 校 验 。 
e [| [| Cookiel| [U |] U 

这 令 Java 9 无 声 地 失败 了 , 而 不 可 思议 地 令 Perl 5 也 失败 了 。 其 他 的 实现 (包括 所 有 的 PHP 
实现 )， 或 是 操作 成 功 ， 或 是 被 清晰 的 出 错 提示 拒绝 。 


总 结 一 下 ， 我 们 有 两 个 可 能 对 很 多 人 都 很 意外 的 结 有 来。 首先 ， 只 有 PHP 6 的 实现 通过 所 有 六 
试 ， 或 是 结 末 可 以 接受 。 其 次 ， 除了 CSS 测 试 外 ， 其 他 测试 部 至 少 有 一 个 失败 有 的 Java 实 现 和 一 个 
出 错 的 Perl 实 现 , 但 没有 一 个 出 错 的 PHP 实 现 。 这 样 看 来 ,至少 在 精通 PHPHJ 队 伍 手 里 ，PHP 比 通 
HART BEEK 








cs a long int’l. email SQL cookie 





图 14-9 kA REEMA RE EMRE R. RIPE TAFARN A E 
表现 。 我 们 只 报告 看 上 去 有 些 脆弱 的 行为 ， 并 没有 试图 真正 攻击 程序 。Java 4 
缺失 一 些 功能 而 未 能 完成 这 次 试验 
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14.2.7 嘿 ,“ 插 入 你 自己 的 话题 ”如 何 


我 们 在 这 个 实验 里 也 尝试 过 评估 其 他 一 些 方 面 , 但 有 一 些 太 难 研究 ， 另 一 些 与 平台 之 间 的 差 
异 无 关 。 

比如 ,我 们 曾 预计 ， 在 不 同 平台 上 团队 的 开发 风格 会 有 所 不 同 。 我 们 试图 通过 肉眼 观察 “ 谁 
在 做 什么 ”的 简单 分 类 ， 每 隔 十 五 分 钟 捕捉 一 次 这 些 差异 (有 一 个 人 在 九 只 队伍 之 间 穿 梭 观 察 ) 。 
我 们 也 在 每 个 团队 项 目 版 本 库 中 分 析 了 提交 代码 信息 的 “时 间 、 人 物 、 文 件 ” 模 式 。 但 是 ， 这 些 
数据 都 没有 显示 出 平台 的 差异 。 

当然 , 我 们 也 试图 调查 性 能 和 可 扩展 性 。 不 幸 的 是 , 这 个 项 目的 功能 点 太 少 , 不 足以 进行 比较 。 

同样 的 ， 本 章 中 , 许多 相关 的 细节 都 没有 明确 说 明 。 关 于 这 项 研究 的 详细 资料 在 我 2007 年 的 
文章 中 中 可 以 找到 。 稍 短 但 仍然 相当 精确 的 是 2010 年 的 文章 中 。 


14.3 ABM AH 


NEL, 那么 这 两 个 完全 不 同 的 研究 对 我 们 来 说 有 什么 用 呢 ? 现 有 的 证 据 数 量 太 小 , 无 法 得 出 强 
有 力 的 、 可 推广 的 结论 。 但 我 们 可 以 结合 日 己 对 于 软件 界 的 个 人 理解 ,使 得 我 们 的 一 些 偏见 至 少 
比 以 前 看 来 更 有 所 依据 。 如 末 是 我 的 话 ， 我 会 得 出 类 似 如 下 的 结论 。 
O 关于 编程 语言 ， 至 少 对 于 文字 处 理 〈 或 类 似 的 普通 行为 ) 这 样 的 小 型 程序 ， 可 以 保险 地 
说 ， 脚 本 语言 比 传统 静态 类 型 语言 的 工作 效率 更 高 。 
O 至 于 编码 实现 的 效率 ， 更 重要 的 是 避免 使 用 模 粒 的 程序 员 ， 而 非 错误 的 语言 。 有 很 多 方 
法 (和 语言 ) 可 以 帮助 你 把 事情 做 好 。 
O 如 采 在 性 能 上 要 求 非 常 高 或 内 存 使 用 非常 低 ，C 和 C++ 仍然 是 最 优 的 选择 ， 当 且 仅 当 程 序 
员 有 足够 的 能 
O 似乎 有 种 特定 的 语言 文化 ， 有 时 会 导致 不 同 语言 的 程序 员 使 用 不 同 的 方法 来 设计 程序 。 
O 对 Web 开 发 平台 而 言 , 当 需 要 开发 的 Web 系 统 不 是 特别 复杂 而 团队 也 能 够 胜任 其 开发 工作 
的 时 候 ， 这 个 系统 所 使 用 的 框架 就 成 了 编程 的 语言 ， 而 对 于 此 框架 的 稳 担 程度 迁 比 语言 
本 里 的 好 坏 更 重要 。 
O 特别 是 当 有 能 力 的 专业 人 士 使 用 PHP 时 ，PHP 比 它 的 名 声 好 很 多 。 
O 各 种 Web 开 发 平台 似乎 都 有 目 己 的 特定 文化 , 有 时 会 导致 不 同 平 台 的 团队 使 用 不 同 的 方法 
来 解决 问题 。 
你 的 看 法 可 能 会 有 所 不 同 , 你 将 来 的 路 也 会 有 所 不 同 。 为 了 真正 了 解 每 个 语言 和 平台 的 特长 ， 
以 及 使 用 这 些 语言 或 者 平台 有 什么 样 的 特点 , 我 们 还 有 许多 诸如 此 类 的 人 研究 要 做 。 而 且 这 些 问题 
本 身 也 不 停 地 在 变化 。 
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质量 之 战 : 开 溪 软件 对 战 
专 有 软件 


Diomidis Spinellis 


光 说 没 用 ， 拿 代码 出 来 。 
Linus Torvalds” 
当 开 发 人 员 比 较 开源 软件 与 专 有 软件 时 ,本 应 该 是 一 场 文明 辩论 ， 却 往往 演变 成 一 场 充满 火 
药 味 的 战争 。 其 实 没 有 必要 如 此 ， 因 为 其 中 有 足够 的 空间 让 我 们 做 出 一 个 冷静 、 客 观 的 比较 。 
研究 人 员 采 用 了 一 些 补充 方法 来 研究 各 种 开源 软件 开发 过 程 的 效率 。 
口 一 种 方法 研究 了 代码 质量 ， 即 内 部 质量 属性 ， 如 注释 密度 或 全 局 变量 的 使 用 情况 ” 。 
O 另 一 种 方法 涉及 检测 软件 的 外 部 质量 属性 ， 反 映 软件 面 对 最 终 用 户 的 情况 “|。 
D 然后 ， 除 了 软件 本 时， 可 以 观 侍 软件 开发 过 程 和 检查 代码 构建 和 维护 的 数据 指标 ， 比 如 
每 周 添加 多 少 代 码 ， 缺 陷 解 决 的 速度 等 ”“。 
O 另 一 些 方法 讨论 了 一 些 特殊 的 情况 ， 比 如 Hoepman 和 Jacobs “通过 研究 Windows NT 系统 
和 Diebold 投 票 系统 的 一 些 源 代码 流出 之 后 是 如 何 遭 到 攻击 的 , 来 研究 开源 软件 的 安全 性 。 
他 们 也 研究 了 开源 软件 如 何 产 生 较 为 清晰 的 代码 ， 且 允许 安全 检查 工具 的 检测 。 
O 其 他 的 一 些 和 争论 基本 上 就 是 嘴 例 而已， 十 几 年 前 ，Bob Glass “就 预言 了 这 种 趋势 的 走俏 
会 随 着 Linux 的 发 展 而 出 现 。 
虽然 多 年 来 很 多 研究 员 对 于 开源 软件 工件 和 流程 进行 了 研究 ( 见 参考 文献 [11]、[39]、[3]、 
[10]、[45]、[3]、[33]、[42])， 但 开源 系统 直接 与 相应 的 专用 软件 做 比较 一 直 古 一 个 可 望 而 不 可 
及 的 目标 。 原因 是 很 难 找到 与 菜 个 开源 软件 相似 并 且 可 比 的 专用 软件 , 并 且说 服 专用 软件 的 所 有 
者 提供 源 代码 来 做 一 个 客观 的 比较 。 然 而 ， 随 着 Sun 的 Solaris 内 核 开 源 (现在 甲骨 文 的 一 部 分 ) 
和 提供 给 研究 机 构 的 Windows 内 核 的 源 代 码 ， 让 我 们 得 以 有 机 会 比较 一 个 开源 软件 的 源 代码 与 专 
有 软件 的 源 代码 。 
在 这 里 ， 我 对 代码 质量 的 度量 方法 基于 我 收集 的 四 个 大 型 的 工业 级 的 操作 系统 : FreeBSD 系 
统 ，Linux 操 作 系 统 ，OpenSolaris 和 Windows 人 研究 内 核 (Windows Research Kernel, faj#KWRK), 








@ Linus Torvalds，Linux 创 始 人 。 一 -一 译 者 广 
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本 章 并 不 是 一 个 罪案 追踪 的 过 程 , 所 以 首先 说 明 我 的 主要 发 现 : 这 四 个 系统 的 代码 质量 没有 非常 
大 的 差异 。 现 在 ， 你 已 经 知道 了 结果 ， 但 我 仍然 建议 你 阅读 下 去 ， 因 为 在 下 面 的 部 分 中 ， 你 不 仅 
会 发 现 我 是 如 何 得 到 这 个 结论 的 ， 而 且 还 有 很 多 代码 质量 指标 可 以 用 来 评估 C 编 写 的 软件 代码 质 
量 ， 你 也 可 以 把 它们 用 在 自己 的 代码 上 。 虽 然 其 中 一 些 指 标 疫 有 被 经 验 验证 过 ， 它 们 仍 基于 普遍 
接受 的 代码 规则 ， 因 此 代表 着 对 于 理想 代码 属性 的 大 致 共识 。 本 人 在 2008 年 的 国际 软件 工程 ”“ 
会 议 中 ， 首 次 报告 了 这 些 调查 结果 ， 不 过 这 一 章 包 含 了 更 多 的 细节 。 


15.1 ”以往 的 冲突 


历史 上 写 就 的 每 一 笔者 充满 了 偏见 。 
Fy x, e oh in 


二 十 多 年 前 学 者 们 就 开始 研究 操作 系统 代码 的 质量 属性 “ 。 比 较 开 源 操 作 系 统 的 研 
AIT ， 和 比较 开源 与 非 开源 操作 系统 的 研究 “ ”与 我 们 在 此 讨论 的 工作 十 分 相似 。 

比较 Linux 和 各 种 伯克利 软件 套件 (BSD) “操作 系统 的 可 维护 性 会 发 现 ，Linux 操 作 系 统 比 
各 种 BSD 用 了 更 多 的 、 通 过 全 局 变量 实现 的 模块 间 通 信 〈 称 为 共同 耦合 ，common coupling), R 
的 研究 结 采 中 的 数据 是 文件 苑 围 内 的 标识 符 ， 不 是 全 局 标识 符 ( 见 图 15-11)。 此 外 ， 对 FreeBSD 
和 Linux 操 作 系 统 的 生长 动态 评价 发 现 两 者 都 是 线性 增长 的 ， 之 前 认为 开源 系统 比 商业 系统 增长 
更 快 是 没有 根据 的 。 

Paulson 和 他 的 同事 “的 研究 ， 比 较 了 三 个 开源 项 目 (Linux，GCC 和 Apache) 和 三 个 不 公 
开 的 商业 系统 的 进化 模式 。 他 们 发 现 ,开源 项 目的 缺陷 修正 和 功能 更 新 速度 更 快 。 作 为 非常 受 欢 
迎 的 项 目 ， 这 与 我 们 预期 的 一 致 。 在 另 一 项 以 代码 质量 为 重点 (其 内 部 质量 ) 的 研究 中 ， 研 究 
人 员 使 用 了 一 个 商业 工具 ， 用 与 本 实验 中 类 似 的 指标 来 评估 100 个 开源 应 用 程序 的 代码 ， 评 估 结 
条 的 范围 从 “可 接受 ”到 “需要 重新 写 ”。 然 后 ， 他 们 把 结 有 末 与 该 工具 供应 商 提 供 的 商业 软件 的 
测试 基准 作 比 较 发 现在 软件 组 织 的 度量 标准 下 他 们 评估 的 模块 中 只 有 一 半 被 视 为 可 以 接受 。 同 一 
组 ”的 另 一 个 研究 评估 了 开源 项 目 和 ( 半 ) 专 有 软件 的 可 维护 性 指数 的 进化 。 他 们 的 结论 是 : 
所 有 项 目 都 经 历 了 一 段 时 间 的 可 维护 性 指数 的 恶化 过 程 。 


15.2 ”战场 











你 不 能 选择 你 的 战场 , 上 天 替 你 选 了 ; 但 你 可 以 持 上 你 的 询 帜 , AAI ER pt AHL 
Nathalia Crane® 

15-1 TIR T ARPT THERE ARS Db BACT. PS SCAB 199 1 4E ~ 1993 年 开始 
独立 生存 。 那 个 时 候 ， 微 处 理 右 的 价格 开始 不 再 难以 负担 ， 以 此 为 基础 的 计算 机 开始 支持 32 位 地 





®© BSD (Berkeley Software Distribution) 是 Vnix 的 衍生 系统 ，20 世 纪 70 年 代 由 伯克利 加 州 大 学 开创 。 编者 注 
®© Nathalia Crane， 小 说 家 ， 诗人。 译 者 注 
© 图 15-1 的 箭头 如 果 你 觉得 方向 指 错 了 ， 那 你 是 对 的 。 否 则 重新 读 一 下 UML 的 书籍 
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址 空间 和 内 存 管理 ， 正 因为 这 些 原 因 ， 现 代 操 作 系 统 如 寒 武 纪 生命 大 爆发 一 样 发 展 了 起 来 。 
FreeBSD 和 OpenSolaris 系 统 ， 有 着 共同 的 祖先 ， 可 以 妃 亢 到 1978 年 的 Unixl1BSD 版 本 。FreeBSD 是 
基于 BSD/Net2, 一 个 伯克利 的 Unix 源 代码 发 行 版 ,当中 清除 了 AT&T 的 专 有 代码 。 因 此 , FreeBSD 
和 OpenSolaris 都 包含 在 伯克利 编写 的 代码 ， 只 是 OpenSolaris 中 包含 AT&T 的 代码 。 具 体 来 说 ， 
OpenSolaris 代 码 起 源 于 1973 年 的 Unix 版 本 ， 开 始 时 由 C 语 言 编 写 ” (参考 文献 第 34 页 ) 。2005 年 ， 
Sun 在 开源 许可 证 下 发 布 了 大 部 分 Solaris 的 源 代码 。 

Linux 从 无 到 有 , 都 是 为 了 在 Tanenbaum" 的 面向 教学 、 兼容 POSIX 的 Minix 操 作 系 统 的 基础 上， 
构建 一 个 功能 更 丰富 的 版 本 。 虽然 Linux 借 用 了 Minix 和 Unix 的 想法 , 但 它 并 没有 用 它们 的 代码 “1。 

Windows NT 的 版 权 历 史 可 以 追 济 到 DEC 的 VMS 和 系统， 这 两 个 项 目的 首席 工程 师 都 是 David 
Cutler, Windows NT 是 微软 作为 对 Unix 的 回应 而 开发 的 ， 最 初 作 为 IBM OS / 2 替代 系统 ， 后 来 更 
换 了 16 位 Windows 代 人 码 库 。 本 研究 中 的 Windows 人 研究 代码 (WRK)， 包 括 了 64 位 Windows 内 核 ， 
是 微软 提供 用 于 研究 的 ,该 内 核 是 用 C 以 及 一 些小 扩展 编写 的 。 设备 驱动 程序 、 即 插 妈 用 支持 、 
电源 管理 、 虚 拟 DOS 子 系统 等 未 包含 在 内 。 这 些 未 被 包含 的 部 分 解释 了 WRK 和 其 他 三 个 内 核 巨 
大 的 规模 差异 。 

虽然 我 研究 的 所 有 四 个 系统 都 以 源 代码 方式 提供 ,但 其 开发 方法 明显 不 同 。 微 软 和 Sun 的 工 
程 师 在 其 公司 内 构建 Windows NT 和 Solaris， 如 果 有 外 部 参与 的 话 ， 也 是 很 小 的 。(OpenSolaris 作 
为 开源 项 目 ， 时 间 很 得 ， 因 此 ， 在 我 研究 的 大 致 印 象 中 ， 只 有 很 少 的 代码 可 能 是 由 Sun 外 部 的 开 
发 人 员 开 发 的 。) 此 外 ，Solaris 是 严格 按照 标准 流程 开发 的 ”， 而 Windows NT 则 采用 较为 轻 量 级 
的 开发 方法 ” (文献 资料 223，263，273 ~ 274 页 ) 。FreeBSD 和 Linux 都 使 用 开源 的 开发 方法 ， 但 
其 发 展 过 程 也 是 不 一 样 的 。FreeBSD 主 要 是 由 约 220 个 提交 者 组 成 的 一 个 没有 等 级 划分 的 小 组 开 
发 的 ， 他 们 访问 共享 的 软件 库 ， 这 个 软件 库 最 初 基于 CVS， 目 前 基于 Subversion”1。 相 比 之 下 ， 
Linux 的 开发 者 分 为 四 层 ， 类 似 一 个 金字 塔 。 在 底部 的 两 个 层次 有 成 千 上 万 的 开发 者 开发 补丁 提 
共 给 约 560 名 子 系 统 维 护 人 员 。 在 金字 塔 的 顶端 ，Linus Torvalds， 由 被 信任 的 副手 组 协助 ， 是 唯 
一 负责 将 补丁 加 入 Linux 树 的 人 。 如 今 ，Linux 开 发 人 员 用 git 协 调 代 码 变化 ，git 是 一 个 为 此 目的 
而 建 的 分 布 式 版 本 控制 系统 。 

我 报告 里 的 指标 多 数 是 通过 执行 SQL 查询 来 的 ，SQL 语 名 查询 了 一 个 关系 型 数据 库 ”， 该 数 
据 库 包含 了 每 个 系统 代码 的 组 成 部 分 : 模块 、 标 识 符 、 令 牌 、 方 法 、 文 件 、 注 释 和 它们 之 间 的 关 
系 。 图 15-2 显 示 了 数据 库 的 架构 。 我 通过 运行 C 语 言 的 CScout 重 构 浏 览 器 为 每 个 系统 建立 数据 库 
( 见 参考 文献 [35]、[38])， 并 且 每 个 系统 都 运行 在 儿 个 特殊 的 处 理 絮 配置 上 (处 理 如 的 具体 配置 
包括 一 些 特有 的 宏 定 义 和 文 件 ， 因 此 会 以 不 同 的 方式 处 理 代码 )。 为 了 完整 地 处 理 代码 ，CScout 
必须 定义 一 个 配置 文件 , 定义 处 理 每 个 编译 单元 (C 文 件 ) 的 环境 。 对 于 FreeBSD 和 Linux 的 内 核 ， 
我 检查 了 GNU C 编 译 器 、 连 接 器 以 及 一 些 shell 命 令 之 间 的 调用 关联 。 从 中 记录 下 其 调用 时 的 具体 
参数 格式 (主要 包括 文件 路 径 和 宏 定 义 等 )， 然 后 可 以 用 来 构造 出 CScout 的 配置 文件 。 对 于 

















Q@ Andrew S. Tanenbaum 领 导 编 写 的 MINIX， 是 一 个 用 于 操作 系统 教学 的 类 UNIX 小 型 操作 系统 。 
D 这 个 数据 库 有 1.4 亿 多 条 记录 ， 查 看 相应 的 查询 语句 请 访 回 http://www.spinellis.gr/sw/4kernel/。 


译 者 注 
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OpenSolaris 和 WRK， 我 只 是 对 我 调查 的 所 有 配置 做 了 一 个 编译 连接 (build), ， 记 录 了 在 日 志文 件 
中 出 现 的 执行 过 的 命令 ， 然 后 通过 日 志 中 的 这 些 命令 来 处 理 编译 和 链接 。 
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图 15-1 四 个 史 和 发 展 体系 
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图 15-2 ”代码 分 析 的 数据 库 结 构 


为 了 减少 因为 选择 度量 指标 31 入 的 偏差 , 我 在 建 并 测量 这 些 指 标的 机 制 之 前 就 选择 并 确定 了 
度量 指标 。 这 可 以 帮助 我 避免 基于 结 来 而 选择 指标 的 偏 奔 。 但 是 ,这 种 事前 的 选择 会 产生 很 多 度 
量 指标 ， 比 如 说 每 行 字符 数 ， 诸 如 这 样 的 指标 并 不 提供 任何 有 意义 的 信息 ， 当 然 也 不 会 得 出 一 个 
明确 的 局 家 或 输家 。 另 一 方面 ， 我 对 指标 的 选择 并 不 契 完 全 家 目的 ， 因 为 当 我 设计 实验 时 ， 我 已 
经 十 分 熟悉 FreeBSD 的 站 核 源 代 码 ， 也 得 到 了 Linux、 第 9 个 研究 版 Unix 和 一 些 Windows 设 备 驱 动 
程序 的 源 代 码 。 

这 项 研究 的 其 他 局 限 性 包括 : 参与 研究 的 系统 数量 太 少 (当然 是 指 那 些 大 型 而 且 重 要 的 系 
统 );， 所 采用 度量 指标 的 语言 很 具体 ， 只 禾 盖 了 软件 质量 指标 中 的 可 维护 性 和 可 移植 性 。 最 后 一 
项 限制 也 意味 着 , 这 项 研究 设 有 芳 虑 在 运行 时 决定 的 一 些 重 要 的 软件 质量 特性 : 功能 性 、 可 靠 性 、 
可 用 性 和 效率 。 不 过 ， 这 些 缺 少 的 属性 往往 取决 于 一 些 非 开 发 因素 : BC, PAUL Sy. W 
宛 它 们 将 引入 更 多 的 主观 偏见 ， 比 如 对 于 某 些 操作 系统 或 者 工作 人 负 答 来 说 不 适当 的 配置 。 比 较 操 
作 系 统 之 则 的 安全 性 或 性 能 的 研究 所 引起 的 争议 恰恰 证 明了 这 些 方法 的 不 易 。 

WRK 源 代码 与 其 他 操作 系统 间 巨 大 的 规模 差异 并 没有 像 当 急 认为 的 那样 会 有 很 大 问题 。 一 
项 关于 FreeBSD 多 个 组 件 的 可 维护 性 指数 分布 的 早期 研究 表明 其 可 维护 性 指数 也 是 均匀 分 布 ， 
在 两 端 ” (图 7-3) 有 极 个 别 例 外 。 这 也 就 是 说 ， 我 们 可 以 通过 研究 一 个 大 型 软件 系统 的 一 个 部 
分 来 得 出 对 该 系统 的 评价 。 因 此 ，WRK 中 的 代码 ， 可 以 被 视 为 一 个 子 集 ， 代 表 完 整 的 Windows 
操作 系统 内 核 。 


15.3 ”开战 


没有 任何 作战 计划 在 与 敌人 交锋 后 还 有 效 。 
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表 15-1 显 示 了 被 研究 系统 的 关键 属 性 。 质 量 指 祭 大 致 可 分 为 文件 组 织 、 代 码 结构 、 代 码 风格 、 
预 处 理 和 数据 组 织 。 当 可 以 用 一 个 数字 表示 茶 个 度量 指 慰 时 ， 我 在 表格 中 列 出 4 个 系统 的 值 ， 并 
在 左边 说 明了 理想 情况 下 , 该 数字 应 该 是 高 (1), 或 是 低 (1), 或 趋 近 茶 个 特定 值 (例如 ，= 1)。 
在 其 他 情况 下 ， 我 们 必须 着 眼 于 各 个 值 的 分 布 ， 为 此 我 使 用 烛台 图 ， 如 图 15-3 所 示 。 图 中 的 每 个 

O 好 小 值 ， 在 该 线 的 底部 ， 

OIR (25%) 四 分 位 值 ， 在 盒 的 底部 ， 

O 中 位 数 〈 数 值 用 来 分 离 较 高 的 一 半 和 较 低 的 一 半 ) ， 盒 子 的 水 平 线 ， 

O 高 (75%) 四 分 位 值 ， 在 盒 的 顶部 ， 

O 最 大 值 ， 在 该 线 的 顶部 ， 

O 算术 平均 值 ， 奏 形 。 

超出 图 示范 围 的 最 大 了 最 小 值 用 虚线 表示 ， 并 有 数字 标示 它们 的 准确 值 。 


表 15-1 四 个 操作 系统 的 主要 指标 














z 标 FreeBSD Linux Solaris WRK 

版 本 HEAD 2.6.18.8-0.5 2007-08-28 1.2 
2006-09-18 

配置 1386 AMD64 SPARC64 AMD64 Sun4V, Sun4V, SPARC 1386AMD64 
代码 行 数 ( 千 ) 2599 4150 3000 829 
注释 (TF) 232 377 299 190 
声明 (F) 948 1772 1042 192 
源 文件 4479 8372 3851 653 
链接 模块 1224 1303 561 3 
C 方 法 38 371 86 245 39 966 4820 
TEN 727 410 703 940 136 953 31 908 


15.3.1 文件 组 织 


在 C 语 言 中 ， 源 代码 文件 在 构建 一 个 系统 中 发 挥 了 重要 作用 。 一 个 文件 圈定 了 绾 围 边 界 ， 而 
它 所 在 的 目录 决定 了 搜索 所 包含 头 文件 的 路 径 “。 因 此 , 适当 地 组 织 源 代码 中 的 声明 、 定 义 和 文 
件 所 处 目录 ， 决 定 了 该 系统 的 模块 化 “|。 

图 15-3 显 示 了 C 源 代码 文件 和 头 文件 的 长 度 。 大 多 数 文件 都 小 于 2000 行 代码 。 过 长 的 文件 (如 
在 OpenSolaris 和 和 WRK 中 的 C 文 件 ) 往往 都 有 问题 ， 因 为 它们 难以 管理 ， 有 很 多 依赖 ， 并 且 违 反 了 
模块 化 的 宗旨。 事实 上 ， 最 长 的 头 文 件 有 27000 行 (WRK 中 的 Winerror.h 文 件 )， 集 合 了 来 自 30 个 
不 同 地 方 的 错误 信息 ， 其 中 大 部 分 与 Windows 内 核 无 关 。 

男 一 个 相关 方法 计算 了 源 代 码 中 定义 的 实体 数 而 不 是 行 数 。 在 C 代 码 中 ， 它 计算 全 局 函数 的 
数量 。 在 头 文 件 中 ， 一 个 重要 有 的 实体 十 一 个 结构 ， 在 C 语 言 中 最 接近 类 的 抽象 。 图 15-4 显 示 了 每 
个 C 文 件 中 声明 的 数量 和 每 个 头 文件 中 的 聚集 数 (结构 或 集合 ) 。 理 想 情 况 下 ， 这 两 个 数字 应 该 
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BON, 表明 适当 的 独立 性 。OpenSolaris 和 WRK 中 的 C 文 件 不 如 其 他 系统 , 同时 有 相当 一 部 分 WRK 
中 的 头 文 件 看 起 也 不 怎样 ， 因 为 它们 每 个 都 定义 了 10 多 个 结构 。 
47 792 13 947 


: 27698 | 


FreeBSD Linux Solaris Windows 





12229 = 11645 | 35376 i 27391 





FreeBSD Linux Solaris Windows 


图 15-3” 源 代码 (上) 和 头 文件 (下 ) 行 数 


我 所 研究 的 四 个 系统 有 着 很 有 趣 的 目录 结构 。 正 如 图 15-5 到 图 15-8 中 显示 的 数字 ， 四 个 系统 
中 的 三 个 有 着 相似 的 局 平 结构 。 WRK 的 小 体积 和 复杂 性 反映 了 微软 已 经 将 Windows 内 核 的 大 部 分 
从 中 剥离 了 出 去 。 我 们 看 到 ，Linux 的 目录 在 整个 源 代 码 树 中 分 布 得 相对 均匀 ， 而 在 FreeBSD 和 
OpenSolaris 中 ， 茶 些 目录 是 族 拥 在 一 起 的 。 这 可 能 是 长 时 间 逐 步 发 展 的 结案， 毕 竞 这 两 个 系统 背 
后 都 有 20 多 年 的 历史 (图 15$-1)。Linux 目 录 的 均匀 分 布 也 反映 了 开发 的 分 散 性 。 

在 一 个 更 高 层次 的 粒度 上 , 我 性 罕 了 一 个 目 东 中 的 文件 数 。 同 样 地 ,在 一 个 目录 下 放 很 多 文 
件 ， 束 好 像 一 个 模块 中 有 许多 内 容 。 大 量 文件 会 让 开发 人 员 迷 惑 ， 开 发 人 员 用 例如 grep 的 工具 来 
搜索 文件 群 ， 也 会 寻 致 共享 头 文件 的 标识 符 冲 突 。 表 15-2 中 是 研 究 得 出 的 数据 ，Linux 明 显 落后 。 





198 第 15 章 质量 之 战 ， 开源 软件 对 战 专 有 软件 


12 


10 





FreeBSD Linux Solaris Windows 





FreeBSD Linux Solaris Windows 


图 15-4 ”全 局 函数 (上 ) 和 结构 CP) 

















yw Ni 








15-7 OpenSolaris 的 目录 结构 
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| 


| 
15-8 ”Windows 研 究 内 核 的 目录 结构 








表 15-2 文件 结构 统计 





指 标 理 想 值 FreeBSD Linux Solaris WRK 
每 个 目录 的 文件 数 | 6.8 20.4 8.9 15.9 
C 源 文件 的 头 文件 数 = |] 1.05 1.96 1.09 1.92 
| 


文件 的 平均 结构 复杂 度 32x10" 13x10” 5.4 x 10" 2.6 x 10” 
表格 中 的 第 二 行 表 示 C 源 文件 数 与 头 文 件数 的 比率 。 我 用 以 下 的 SQL 语 言 来 计算 : 


select (select count(*) from FILES where name like '%.c') / 
(select count(*) from FILES where name like '%.h') 


在 标准 的 C 代 码 风 格 指南 中 ， 要 求 每 一 个 模块 的 接口 定义 在 单独 的 头 文件 中 ， 而 在 相应 的 C 文 
件 中 实现 。 因 此 ，C 文 件 与 头 文件 的 最 优 比率 是 1 : 1， 差 异 很 大 可 能 意味 着 接口 和 实现 之 间 的 区 别 
模糊 。 对 于 一 个 小 系统 这 也 许 是 可 以 接受 的 (在 awk 编程 语言 的 实现 里 面 ， 该 比率 是 3 /11) ， 但 对 
于 一 个 有 成 千 上 万 文件 的 系统 来 说 , 这 就 是 个 问题 。 在 这 项 指标 中 , 所 有 系统 的 评分 都 是 可 接受 的 。 

表 15-2 的 最 后 一 行 代 表 文 件 间 关系 的 复杂 性 。 我 用 有 问 图 以 及 图 中 的 节点 (表示 一 个 文件 ) 
来 研究 这 个 问题 。 文 件 引 用 外 部 其 他 文件 中 的 定义 或 声明 元 素 的 数量 ， 称 为 引用 数 (fanout) 。 
例如 ,一 个 C 文 件 , 使 用 了 包括 FILE，,，putc， 和 malloc (定义 在 stdlib.h 和 stdio.h 中 ) 的 三 个 符号 ， 
则 该 C 文 件 的 引用 数 为 3。 相 应 地 ， 我 定义 了 一 个 文件 的 被 引用 数 (fanin) 。 因 此 ， 在 前 面 的 例子 
里 ，stdio.h 的 被 引用 数 是 2。 我 用 Henry 和 Kafura 的 信息 流 度量 法 ' "来 看 文件 之 间 的 对 应 关系 。 

表格 中 数据 的 计算 公式 是 : 











(被 引用 数 x 引用 数 》 
我 用 CScout 数 据 库 中 INCTRIGGERS 表 的 数据 进行 计算 ,该 表 存 储 每 个 文件 中 的 链接 到 其 他 
文件 的 符号 (symbol), 


select avg(pow(fanout.c * fanin.c, 2)) from 

(select basefileid fid, count(definerid) c from 
(select distinct BASEFILEID, DEFINERID, FOFFSET from INCTRIGGERS) i2 
group by basefileid) fanout 

inner join 

(select definerid fid, count(basefileid) c from 
(select distinct BASEFILEID, DEFINERID, FOFFSET from INCTRIGGERS) 工 2 
group by definerid) fanin 

on fanout.fid = fanin.fid 
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计算 方式 如 下 : 最 内 层 的 SELECT 语 句 从 各 个 文件 相关 的 外 部 定义 和 51 用 表 中 找到 其 中 互 不 
重复 的 标识 符 集合 ， 及 其 定义 或 引用 所 在 的 文件 。 然后， 中 层 的 select 语 句 计 算 每 个 文件 中 的 
标识 符 数 量 ， 最 外 和 面 的 select 语 句 把 各 个 文件 中 的 外 部 定义 以 及 引用 相互 联接 ， 从 而 计算 得 到 
相应 的 信息 疲 指标 。 这 个 值 很 大 的 话 ， 和 意味 着 频 华 的 变动 或 是 结构 缺陷 。 





15.3.2 ”代码 结构 


这 四 个 系统 的 代码 结构 说 明了 如 何 通 过 不 同 的 控制 结构 和 不 同 的 侧重 点 解决 相似 的 问题 , 也 
使 我 们 能 够 一 舌 每 个 系统 设计 。 

图 15-9 显 示 了 跨 方法 的 扩展 圈 复 杂 度 (Cyclomatic complexity) 指标 ”。 它 衡量 了 每 个 方法 
中 所 包含 的 独立 路 径 的 数量 。 这 个 数字 包括 布尔 和 条 件 语句 (因为 它们 引入 额外 的 路 径 )， 但 不 
包括 多 癌 swWitch 语 句 ， 因 为 它 会 不 均衡 地 影响 相似 代码 的 研究 结 末 。 度 量 的 目的 是 要 衡量 一 个 程 
序 的 可 测试 性 、 可 理解 性 以 及 可 维护 性 “。 在 这 方面 ，Linux 的 成 绩优 于 其 他 系统 ，WRK 最 精 。 
这 些 数字 也 显示 了 每 个 方法 中 C 语 句 的 数目 。 理 想 的 情况 下 , 这 应 该 是 一 个 小 数目 《例如 , 约 20)， 
国 数 的 所 有 代码 都 可 以 显示 在 屏 戎 上 。 这 反 上 ，Linux 再 次 优 于 其 他 系统 。 








FreeBSD Linux Solaris Windows 


1,073 $ 1,084 = 1,209 





FreeBSD Linux Solaris Windows 





图 15-9 圈 复 杂 度 分 布 (上 ) ， 每 个 方法 中 C 语 句 数 目 (下 ) 
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15-10 显 示 了 Halstead 量 复杂 度 “。 对 于 给 定 代码 来 说 ， 需 要 考察 代码 中 4 个 数值 : 
e n] 
不 同 操作 符 的 数量 。 
e n2 
不 同 操作 数 的 数量 。 
e NI 
所 有 操作 符 的 数量 。 
e N2 
所 有 操作 数 的 数量 。 
利用 这 4 个 数值 ， 计 算 量 复杂 度 的 公式 为 : 
(Nl+N2)xlog,(nl+n2) 
比如 ， 对 于 这 个 表达 式 .: 


(1x ? (ly ? upleft : (y == bottom ? lowleft : left)) 
= last ? (ly ? upright = (y == bottom ? Lowright. = right) } 
y ? upper : (y == bottom ? lower : normal)))) [w->orientation]; 


这 4 个 变量 有 如 下 取 值 : 


e nl 


bottom last left lower lowleft lowright normal op orientation right upleft upper 
upright w x y (16) 


e NI 
27 
e N2 
24 
Halstead 量 复杂 性 育 后 的 理论 说 明 ， 该 值 如 采 低 的 话 则 表示 代码 好 理解 。 但 是 ， 这 项 度量 指 
标本 身 经 常 受到 批评 。 在 这 里 ，Linux 的 成 绩 最 好 ，WRK 比 其 他 系统 都 差 。 


42248 È 46924 | 47870 + 30391 
7 : á 





FreeBSD Linux Solaris Windows 
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退 一 步 看 国 数 之 间 的 交互 ， 图 15-11 反 映 了 功能 耦合 度 ， 它 吕 示 了 国 数 内 一 个 标识 符 来 目 于 
编译 单元 作用 域 (文件 作用 域 的 标识 符 或 静态 标识 符 ) 或 是 项 目 作用 域 〈 全 局 对 象 ) 的 百分比 。 
这 两 种 形式 的 耦合 都 是 不 可 取 的 , 全 局 标识 符 比 文件 作用 域 标 识 符 更 为 精 糕 。 全 局 范 围 中 ，Linux 
的 共同 耦合 情况 比 其 他 系统 好 ,但 〈 可 能 因为 如 此 ) 文件 作用 域 的 分 数 比 其 他 系统 更 差 。 其 他 系 


统 比较 均衡 。 


表 15-3 是 与 代码 结构 有 关 的 其 他 指标 。 全 局 函数 指 整个 系统 都 可 见 的 冰 数 。 这 种 函数 的 个 数 
在 WRK 中 (接近 100%， 手 工 验证 过 ) 高 得 惊人 。 然 而 ， 这 可 能 反映 了 微软 使 用 不 同 的 技术 ， 比 


如 连接 到 共享 库 (DLL) 和 显 式 导出 符号 (Symbol), ， 以 避免 标识 符 钟 突 。 


表 15-3 ”代码 结构 指标 








指 标 理 想 值 FreeBSD Linux Solaris 
全 局 国 数 百分比 | 36.7 212 45.9 
结构 严格 的 函数 百分比 i 27.1 68.4 65.8 
标记 语句 百分比 | 0.64 0.93 0.44 
函数 参数 平均 数量 | 2.08 1.97 2.20 
PLY RE | 0.86 0.88 1.06 
每 个 语句 的 记号 数 | 9.14 9.07 9.19 
重复 代码 的 记号 数 百 分 比 | 4.68 4.60 3.00 
图 数 的 平均 结构 复杂 度 | 7.1 x 104 1.3 x 108 3.0 x10° 
100 
80 
60 
40 
20 
0 


FreeBSD Linux Solaris Windows 





2 E 
FreeBSD Linux Solaris Windows 


图 15-11 文件 级 (上 ) 和 全 局 (下 ) 的 一 般 耦 合 


WRK 
99.8 
PAI 
0.28 
2.13 
1.16 
8.44 
3.81 
6.6 x10° 
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结构 严格 的 函数 付 合 如 下 规定 : 单反 结束 ， 没 有 goto 语 句 。 这 扩 人 很 容 多 被 验证 。 通 过 以 下 
语句 来 观察 每 个 函数 中 的 关键 词 就 可 以 计算 这 些 语句 的 百分比 : 


select 100 - 
(select count(*) from FUNCTIONMETRICS where nreturn > 1 or ngoto > 0) / 
(select count(*) from FUNCTIONMETRICS) * 100 


沿 着 同样 的 思路 ， 标 记 语 句 的 百分比 表明 了 goto 的 目标 : 这 违反 了 结构 编程 原则 。 我 这 里 
计算 标记 语句 而 不 是 goto 语 句 ， 因 为 众多 分 支 目 标 比 众多 分 支 源头 更 让 人 困惑 。 通 常会 有 多 个 
goto 语 句 指 向 同一 个 标记 语句 ， 用 来 退出 函数 去 做 一 些 清理 工作 ， 这 与 异常 处 理 的 finally 语 
句 相似 。 

国 数 参数 的 数量 体现 了 接口 的 质量 。 当 一 个 图 数 有 很 多 参数 时 ， 把 参数 包装 成 一 个 结构 会 减 
低 混 乱 ， 也 可 以 易于 优化 ， 提 高 性 能 。 

最 深 柑 套 的 平均 深度 与 每 个 语句 的 标记 数 表 示 了 代码 的 可 理解 性 。 SRE FRE RAIL IB 
不 易于 理解 的 理论 ”。 

重复 代码 意味 着 缺陷 和 维护 问题 | (参考 文献 的 413~416 页 ) 。 相 应 的 度量 指标 (重复 代 
码 记号 数 百 分 比 ) 表示 至 少 在 一 个 克隆 代码 中 出 现 过 的 代码 段落 百分比 。 我 用 CCFinderXs 的 工具 
寻找 重复 代码 ， 用 Perl 脚 本 ( 见 示例 15-1) 来 找 出 相应 的 比率 。 


示例 15-1 从 CCFinderX 来 找 出 重复 代码 的 比率 


# Process CCFinderX results 
open (IN, "ccfx.exe P SARGV[0].ccfxd|") || die; 
while (<IN>) { 
chop? 
if (/*source_files/ .. /*\}/) { 
# Process file definition lines like the following: 
# 611 /src/sys/amd64/pci/pci_bus.c 1041 
(Sid, $name, Stok) = split; 
Stile([Sid)] (Stok = 1] = 0 if tok > 0); 
Snfile++; 
} elseif (/*clone_pairs/ .. /*\}/) { 
# Process pair identification lines like the following for files 14 and 363: 
# 1908 14.1753-1832 363.1909-1988 
($id, Sch, $c2) = split; 
mapfile(Scl1) ; 
mapfile(S$c2) ; 





} 


# Add up and report tokens and cloned tokens 
for (Sfid = 0; Sfid <= S#file; Sfid++) { 
for (Stokid = 0; Stokid <= S#{Sfile[Sfid]}; Stokid++) { 
Sntok++; 
Snclone += S$file[Sfid] [Stokid]; 


@ http://www.ccfinder.net/ , 
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} 
print "SARGV [0] nfiles=Snfile ntok=Sntok nclone=Snclone ", Snclone / Sntok * 100, "\n"; 


# Set the file's cloned lines to 1 
sub mapfile 


{ 


my(Sclone) = @_; 
my (Sfid, $start, Send) = (Sclone =~ m/*(\d+)\. (\d+)\-(\d+)S$/); 
for ($i = $start; $i <= Send; $i++) { 

Stile[Sid] [si] = 1; 


} 





最 后 ,函数 的 平均 结构 复杂 度 还 是 用 Henry 和 Kafura 的 信息 流 度量 法 "来 找 出 函数 间 的 联系 。 
理想 中 ， 这 个 值 要 尽量 地 小 ， 意 味 着 函数 提供 者 和 使 用 者 被 适当 地 分 离开 。 


15.3.3 ”代码 风格 


缩 进 、 间 中 、 标 识 符 命 名 、 篆 量 名 称 、 命 名 规则 的 各 种 选择 都 会 在 功能 不 变 的 情况 下 影 啊 代 
码 的 表达 (参见 参考 文献 [21]、[12]、[1]、[40])。 在 大 多 数 正 常情 况 下 ， 代 码 风 格 的 一 致 性 比 选 
择 哪 种 代码 风格 更 重要 。 

在 这 项 研究 中 ,我 用 indqent 程 序 来 排版 每 个 系统 的 所 有 代码 ， 统 计 有 多 少 行 代码 被 indent 修 
改 了 ， 以 此 来 衡量 各 系统 代码 风格 的 一 致 性 。 表 15-4 的 第 一 行 就 是 这 一 项 实验 的 结果 。 可 以 修改 
Indent 的 参数 来 符合 特定 的 排版 要 求 。 比 如 你 可 以 修改 缩 进 量 与 括 志 的 位 置 。 为 了 确定 每 个 系 
统 的 排版 样式 (format style) 和 使 用 合适 的 排版 选项 ， 首 先 ， 我 依次 尝试 设 定 15 种 不 同 的 数值 型 
标记 ， 以 及 逐个 开局 或 关闭 55 个 布尔 型 标记 来 找到 合适 的 标记 组 合 (参见 示例 15-2 和 示例 
15-3shell 脚 本 ) 。 继 而 我 以 此 来 选择 能 产生 与 原 有 代码 风格 最 一 致 的 一 组 标记 组 合 。 例 如 ， 对 
OpenSolaris 的 源 代码 ， 用 indent 及 其 默认 参数 将 重新 排版 74% 的 代码 行 。 一 旦 确定 了 相应 的 标 
id (-i8 -b1li0 -cbi0 -ci4 -ip0 -bad -bbb -br -brs -ce -nbbo -ncs -nlp -npcs) , 
这 个 数值 将 减少 至 16%。 


表 15-4 ”代码 风格 指标 








指 标 理 想 值 FreeBSD Linux Solaris WRK 
代码 行 风 格 一 致 百分比 j T27 77.96 84.32 33.30 
typedef 风 格 一 致 百分比 1 57.1 59.2 86.9 100.0 
聚合 标记 风格 一 致 百分比 j 0.0 0.0 20.7 98.2 
每 行 的 字数 | 30.8 29.4 272 28.6 
操作 数 数值 常数 百分比 | 10.6 13.3 7.7 7.7 
不 安全 有 的 类 函数 宏 命 令 百 分 比 | 3.99 4.44 9.79 4.04 
注释 拼写 错误 百分比 | 33.0 31.5 46.4 10.1 
特殊 注释 拼写 错误 百分比 | 6.33 6.16 5.76 3.23 
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示例 15-2 HE RSE A ET 


DIR=$1 
NFILES=0 
RNFILES=0 


# Determine the files that are OK for indent 
for f in `find SDIR -name '*.c'~ 
do 
# The error code is not always correct, so we have to grep for errors 
if indent -st $f 2>&1 >/dev/null | grep -q Error: 
then 
REJECTED="SREJECTED $f" 
RNFILES= expr SRNFILES + 1` 
echo -n "Rejecting $f - number of lines: " 
wc -l <Sf 
else 
FILES="SFILES sf" 
NFILES= expr SNFILES + 1° 
fi 
done 


LINES=‘echo SFILES | xargs cat | we -1` 
RLINES= echo $REJECTED | xargs cat | we -1` 


# Format the files with the specified options 
# Return the number of mismatched lines 
Eey) 
{ 
for f in SFILES 
do 
indent -st SIOPT $1 $f | 
diff Sf = 
done | 
grep "^<" | 
we -1 


# Report the results in a format suitable for further processing 
status () 
{ 
echo "SIOPT: SVIOLATIONS violations in SLINES lines of SNFILES files \ 
(SRLINES of SRNFILES files not processed)" 
} 


# Determine base case 
VIOLATIONS=*try~ 
Status 
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示例 15-3 ”确定 系统 缩 进 格式 选项 ( 续 ) 


# Try various numerical options with values 0-8 
for try opt in i ts bli c cbi cd ci cli cp d di ip 1 lc pi 
do 

BEST=SVIOLATIONS 

for n in 0 12345678 


do 
NEW= try -$try_opt$n` 
if [ SNEW -lt SBEST ] 
then 
BNUM=Sn 
BEST=SNEW 
fi 
done 
if [ SBEST -lt SVIOLATIONS | 
then 
IOPT="SIOPT -Stry_optSBNUM" 
VIOLATIONS=SBEST 
status 
fi 
done 


# Try the various Boolean options 

for try_opt in bad bap bbb bbo pc bl bls br brs bs cdb cdw ce cs bfda \ 
bfde fc1 fca hnl lp lps nbad nbap nbbo nbc nbfda ncdb ncdw nce \ 
ncs nfcl nfca nhnl nip nlp npcs nprs npsl nsaf nsai nsaw nsc nsob \ 
nss nut pcs prs psl saf sai saw sc sob ss ut 


do 
NEW= try =Stry opt” 
if [ SNEW -lt SVIOLATIONS ] 
then 
IOPT="SIOPT -Stry_opt" 
VIOLATIONS=SNEW 
fi 
status 
done 





图 15-12 描 述 了 两 类 重要 的 C 标 识 符 的 长 度 分 布 : EARR (SEM) 和 用 来 鉴别 
聚合 的 标签 《结构 和 联合 )。 因 为 每 个 类 通 稍 使 用 独立 的 命名 空间 ， 选 择 不 同 的 可 识别 名 称 很 重 
要 ( 见 参考 文献 [25] 第 31 章 )。 对 于 这 些 标 识 符 类 ， 较 长 的 名 称 是 比较 可 取 的 ， 这 两 种 情况 下 ， 
WRK 最 棒 ， 任 何 使 用 Windows API 编 程 的 程序 员 应 该 很 容易 猜 到 这 一 抬 。 

表 15-4 中 相关 代码 风格 的 其 他 一 些 指标 出 现 。 为 了 测量 的 一 致 性 ， 我 通过 代码 检测 来 确定 
typedef 和 聚合 标签 的 命名 规则 ， 然 后 计算 不 匹配 规则 的 标识 符 。 这 里 我 运行 了 两 个 SQL 查 询 ， 
一 个 在 类 Unix 系 统 ， 一 个 在 WRK 中 : 


select 100 * (select count(*) from IDS where typedef and name like '%_t') / 
(select count(*) from IDS where typedef) 

select 100 * (select count(*) from IDS where typedef and name regexp '*[A-Z0-9_]*$') / 
(select count(*) from IDS where typedef) 


以 下 十 检查 编程 风格 是否 违反 编程 准则 的 其 他 三 个 指标 : 
O 过 长 的 代码 行 (每 行 字符 数 )，; 
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O 代码 中 直接 使 用 的 “魔法 ”数字 (操作 数 中 出 现 数值 常量 的 百分比 ); 
O 置 于 If 语 句 之 后 会 导致 异常 行为 的 类 函数 宏 的 定义 (不 安全 的 函数 宏 的 百分比 )。 
30 , , l 





43 : 73 : 50 
25 : z 
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FreeBSD Linux Solaris Windows 





FreeBSD Linux Solaris Windows 
图 15-12 全 局 标识 符 长 度 (上 ) ， 聚 合 标识 符 长 度 〈 下 ) 
下 面 的 SQL 查询 粗略 计算 了 不 安全 的 类 国 数 安 的 数量 ， 寻 找 那些 含有 多 个 语句 ， 但 没有 ao 
关键 字 的 宏 。 
结果 显示 的 是 一 个 下 界 , 因为 查询 可 能 会 遗漏 其 他 不 安全 的 宏 , 比如 那些 舍 有 if 语 句 的 不 安 


全 宏 


Nt 


select 100.0 * (select count(*) from FUNCTIONMETRICS left join 
FUNCTIONS on functionid = id where defined and ismacro and ndo = 0 and nstmt > 1) / 
(select count(*) from FUNCTIONS where defined and ismacro) 


注释 是 代码 风格 的 男 一 个 重要 因素 。 但 很 难 客观 判断 代码 注释 的 质量 。 注释 可 能 是 多 余 的 其 
至 是 错误 的 。 我 们 不 能 编程 来 判断 注释 质量 ,但 是 我 们 可 以 很 容易 地 测量 注释 密度 。 图 15-13 显 
示 了 5C 文 件 中 ， 广 释 字符 对 语句 的 比率 。 在 头 文件 中 ， 我 计算 了 定义 元 素 对 注释 数量 的 比率 ， 通 
前 定义 元 素 需 要 注释 〈 枚 举 、 聚 合 及 其 成 员 、 变 量 声明 和 类 国 数 的 宏 )。 在 这 两 种 情况 下 ， 都 排 
除了 内 容 很 少 的 文件 。WRK 具 有 明显 的 一 致 性 ，Linux 在 这 方面 表现 较 靶 。 有 趣 的 是 ， 注 释 平 均 
值 要 比 中 位 数 高 ， 表 明 一 些 文件 中 的 注释 比 其 他 文件 多 许多 。 


select nccomment / nstatement from FILES where name like '%.c' and nstatement > 0 











select (nlcomment + nbcomment) / (naggregate + namember + nppfmacro + nppomacro + 
nenum + npfunction + nffunction + npvar + nfvar) from FILES 





© 类 函数 宏 包 含 了 不 止 一 个 语句 ， 并 且 代 码 体 在 do. . .while(0) 中 ， 使 它们 像 一 个 对 于 真实 函数 的 调用 。 


where name like '%.h' and naggregate + namember + nppfmacro + nppomacro > 0 
and nuline / nline < .2 
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图 15-13 C 文 件 中 的 注释 密度 (上 ) ， 头 文件 中 的 注释 密度 (T) 


同时 , 我 也 计算 了 拼写 错误 ,这 也 古代 码 质 量 的 指标 之 一 。 我 用 所 有 系统 的 标识 符 和 文件 名 
组 成 了 一 个 字典 ， 基 于 该 字典 用 aspell 来 检查 注释 (参见 示例 15-4 中 的 脚本 )。WRK 的 错误 很 少 ， 
根据 相应 的 文档 ， 表 明代 码 发 布 之 前 做 过 拼写 校 验 。 


示例 15-4 ”在 Cscout 的 数据 库 中 计算 注释 以 及 拼写 错误 


# Create personal dictionary of correct words 
# from identifier names appearing in the code 
PERS=S$1 .en .pws 
( 
echo personal_ws-1.1 en 0 
( 
mysql -e 'select name from IDS union select name from FUNCTIONS union 
select name from FILES' $1 | 
tx Jin VW | 
sed 's/\([a-z]\)\([A-Z]\)/\1\ 
\2/g' 
mysql -e 'select name from IDS union select name from FUNCTIONS union 
select name from FILES' $1 | 
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sort -u 
) >SPERS 
# Get comments from source code files and spell check them 
mysql -e 'select comment from COMMENTS left join FILES 

on COMMENTS.FID = FILES.FID where not name like "%.cs"' $1 | 
sed 's/\\[ntrb]//g' | 
tee $1.comments | 


aspell --lang=en --personal=SPERS -C --ignore=3 --ignore-case=true \ 
--run-together-limit=10 list >S$l.err 

we -w $1.comments # Number of words 

we -l $l.err # Number of errors 


虽然 我 没有 客观 衡量 可 移植 性 , 但 用 CScout 处 理 源 代码 的 过 程 让 我 感觉 到 各 系统 的 源 代码 对 


于 不 同 的 编译 器 可 移植 性 会 不 同 。Linux 和 WRK 中 的 代码 似乎 是 与 一 个 特定 的 编译 器 紧密 绑 定 
的 。Linux 使 用 GNU C 编 译 器 提供 的 各 种 语言 的 扩展 ， 有 时 还 包括 伪装 成 被 gcc 认 作 C 语 法 的 汇编 
代码 ( 见 示例 15-5)。WRK 中 使 用 相当 少 的 语言 扩展 ， 但 依赖 于 微软 编译 器 提供 的 C 语 言 的 try 
catch 扩 展 。FreeBSD 只 用 了 少数 gcc 的 扩展 ， 并 用 宏 标 出 。OpenSolaris 表 现 不 俗 ， 是 源码 中 唯一 
不 需要 Cscount 之 外 的 扩展 来 编译 的 。 


示例 15-5 Linux 内 核 中 memmove 的 定义 


void *memmove(void *dest, const void *src, size_t n) 


{ 
int d0, d1, d2; 


if (dest < src) { 
memcpy (dest,src,n); 
} else { 
asm _ _ volatile ( 
"std\n\t" 
"rep\n\t" 
"movsb\n\t" 
"cid" 
: “Sec" (d0), "=&S" (d1), "=&D" (d2) 
sro (A) 
"1" (n-1+(const char *) src), 
"2" (n-1+(char *)dest) 
: "memory" ); 
} 
return dest; 


} 


15.3.4 fash 


C 语 言 的 语言 规范 与 它 的 〈 不 可 或 缺 的 ) 预 处 理 器 之 间 的 关系 不 是 一 句 话 就 能 说 清楚 的 。 尺 
管 C 和 真正 的 程序 很 大 程度 上 依赖 于 预 处 理 右 ， 但 它 的 特性 前 笛 造 成 可 移植 性 ， 可 维护 性 和 可 靠 
性 的 问题 。 预 处 理 右 ， 作 为 一 个 强大 的 ， 但 粗 烙 的 手段 ， 在 识别 标识 符 的 作用 邯 围 上 很 畔 ， 解 析 
和 重 构 没 有 预 处 理 过 的 代码 的 能 力也 不 剖 ,， 在 不 同 的 平台 编译 代码 的 方式 也 不 好 。 因 此 ， 大 多 数 
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C 编 程 指南 推荐 适度 地 使 用 预 处 理 絮 结构 (preprocessor construct), 。 也 因为 这 个 原因 ， 以 C 为 基础 
的 现代 语言 部 试图 提供 可 以 取代 C 预 处 理 如 的 其 他 规 沁 选择。 例如 ，C++ 提 供 的 第 量 和 强大 的 模 
板 蔡 代 C 的 安 ，C#H 担 供 类 预 处 理 功 能 用 来 帮助 条 件 编译 和 代码 生成 。 

预 处 理 豆 的 功能 可 通过 预 处 理 右 运行 时 代码 的 膨胀 或 收缩 量 来 衡量 。 图 15-14 包 含 两 个 这 样 
的 衡量 手段 : 函数 体 【( 即 代码 膨胀 )， 函 数 体外 的 元 素 ( 即 数据 定义 和 声明 )。 这 两 个 测量 了 计算 
进入 预 处 理 絮 的 标记 与 预 处 理 结束 时 的 标记 的 比率 。 下面 古 本 人 计算 函数 体内 代码 脱 胀 用 的 SQL 
查询 语句 : 


select nctoken / npptoken from FUNCTIONS 
inner join FUNCTIONMETRICS on id = functionid 
where defined and not ismacro and npptoken > 0 





FreeBSD Linux Solaris Windows 





FreeBSD Linux Solaris Windows 


图 15-14 ”函数 内 的 预 处 理 膨胀 (上)， 文 件 内 的 预 处 理 脱 胀 (下 ) 
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膨胀 和 收缩 都 令 人 担忧 。 膨 胀 象征 着 复杂 的 宏 ， 收 缩 则 表示 条 件 编译 ,这 都 是 有 害 的 ”“。 因 
此 ,这 些 指标 的 值 应 该 徘徊 在 1。 在 关于 函数 的 图 中 ，OpenSolaris 的 成 绩优 于 其 他 系统 ，FreeBSD 
最 糟 。 在 关于 文件 的 情况 下 ，WRK 比 其 他 系统 都 差 许 多 。 

表 15-5 显 示 了 其 余 4 个 衡量 预 处 理 器 不 安全 因素 的 指标 。 

O 头 文件 中 的 指令 (directives) (多 数 情况 下 需要 )。 

O 头 文 件 中 非 - 大 nclude 的 指令 (很 少 用 到 )。 

O 函数 中 的 预 处 理 器 命令 (会 产生 不 人 确定 值 )。 

O 函数 中 的 预 处 理 条 件 (影响 可 移植 性 )。 


表 15-5 ” 预 处 理 指标 











指 标 理 想 值 FreeBSD Linux Solaris WRK 
头 文件 中 的 指令 百分比 | 22.4 21.9 21.6 10.8 
头 文件 中 非 磋 nclude 的 指令 百分比 | 2.2 1.9 1.2 1.7 
PAB FE TUDE as fis > A LE l 1.56 0.85 0.75 1.07 
函数 中 的 预 处 理 条 件 百 分 比 | 0.68 0.38 0.34 0.48 
Ze SL RI CR AYE PRICY Ze or LE | 26 20 25 64 
单独 标识 符 中 的 宏 百 分 比 | 66 50 24 25 
标识 符 中 的 宏 百 分 比 | 32.5 26.7 22.0 371 


MEORE, RETZE (我 们 称 这 些 宏 为 类 对 象 宏 ) 和 函数 (我 们 称 之 为 类 函数 的 宏 )。 在 
DURCH BH, RIRE T ATLA AEN, FERRARA ERB. PRS Tian al REH 
于 C 的 块 (block)， 因 此 ， 比 宏 安 全 ， 因 为 宏 作 用 于 整个 编译 单元 。 表 15-5 最 后 三 个 指标 衡量 了 
类 功能 和 类 对 象 宏 的 数量 。 鉴 于 可 检 代 的 选择 和 与 宏 有 关 的 危险 ， 理 想 值 越 低 越 好 。 


15.3.5 ”数据 组 织 


最 后 一 组 测量 数据 关注 每 个 内 核 的 (内存) 数据 组 织 。C 代 码 数 据 组 织 质 量 的 衡量 标准 ， 取 
决 于 标识 符 的 作用 域 和 数据 结构 的 使 用 。 

与 许多 现代 语言 相反 , C 几 乎 没有 提供 机 制 来 控制 命名 空间 污染 。 函数 只 能 有 两 个 作用 域 ( 文 
件 和 全 局 )， 宏 在 被 定义 的 编译 单元 内 有 效 ， 聚 合 标记 往往 全 局 有 效 。 因 为 可 维护 性 的 绿 故 ， 大 
规模 系统 (如 这 四 个 操作 系统 ) 需要 谨慎 地 使 用 现 有 机 制 ， 以 控制 大 量 的 标识 符 促 突 。 

15-15 显 示 了 每 个 函数 在 开始 处 可 见 的 标识 符 和 宏 的 平均 数量 , 来 显示 C 文 件 的 命名 空间 污 
染 的 程度 。 有 大 约 10 000 个 标识 符 在 任何 系统 的 任何 一 点 都 可 见 ， 很 明显 ， 命 名 空间 污染 是 C 代 
码 回 题 。 然 而 ，FreeBSD 比 其 他 系统 情况 好 护 ，WRK 取 精 。 

表 15-6 前 三 个 指标 研究 每 个 系统 如 何 处 理 其 最 稀缺 的 命名 资源 ， 全 局 标识 符 。 可 以 通过 尽量 
减少 全 局 标识 符 的 数量 来 减少 空间 污染 。 此 外 ,尽量 减少 全 局 变量 作为 操作 数 的 百分比 可 以 降低 
耦合 ， 减 轻 代 码 的 理解 难度 (全 局 标识 符 可 在 组 成 该 系统 的 任何 文件 中 )。 最 后 一 个 指标 统计 了 
可 以 在 静态 泥 围 内 定义 ， 却 被 定义 为 全 局 的 全 局 标识 符 ， 因 为 它们 只 有 一 个 文件 在 访问 而 已 。 对 
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应 的 SQL 查询 计算 了 只 在 一 个 文件 中 存在 的 全 局 标识 符 (链接 单元 ) 百分比 : 


select 100.0 * (select count(*) from 
(select TOKENS.eid from TOKENS 
left join IDS on TOKENS .eld = IDS.eld 
where ordinary and lscope group by eid having min(fid) = max(fid) ) static) / 
(select count (*) trom IDS) 





ee 
图 15-15 “C 文 件 中 命名 空间 污染 平均 水 平 
接 下 来 的 两 个 指标 着 眼 于 变量 声明 和 文件 范围 内 的 操作 数 。 它 们 都 比 全 局 变量 危害 小 , 但 比 
块 作用 域 中 的 变量 危害 大 。 


solaris Windows 














415-6 ”数据 组 织 指标 








指 标 jz 想 H FreeBSD Linux Solaris WRK 

全 局 变量 百分比 | 0.36 0.19 1.02 1.86 
全 局 操作 数 百 分 比 | 3.3 0.5 1.3 2.3 
LRH: op Ae A 7 bk | 0.28 0.17 1.51 3.53 
文件 内 变量 百分比 | 2.4 4.0 4.5 6.4 
文件 内 操作 数 百分比 | 10.0 6.1 12.7 16.7 
每 个 typedef 或 是 聚合 中 的 变量 | 15.13 25.90 15.49 7.70 
每 个 聚合 或 是 枚 举 的 数据 元 素 | 8.5 10.0 8.6 7.3 


最 后 两 个 有 关 数 据 组 织 的 指标 提供 了 一 份 代码 中 抽象 机 制 使 用 的 衡量 标准 。 类 型 定义 和 聚合 
是 C 语 言 中 两 个 主要 的 数据 抽象 机 制 。 因 此 ， 统 计 类 型 定义 与 聚合 函数 的 数量 指示 了 每 个 系统 对 
于 抽象 化 机 制 的 使 用 程度 。 


select ((select count(*) from IDS where ordinary and not fun) / 
(select count(*) from IDS where suetag or typedef) ) 
select ((select count(*) from IDS where sumember or enum) / 
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(select count(*) from IDS where suetag) ) 
BRIA EEL ASL T BET ER A Be BCE BC A a et MS EP ICRI A o 这 像 
是 Chidamber 和 Kemerer 的 面向 对 象 的 每 类 中 加 权 方 法 (WMC) 度量 “之 于 代码 一 样 。 较 高 的 值 
可 能 表明 一 个 结构 试图 存储 太 多 不 同 的 元 素 。 


15.4 成果 和 结论 


有 两 种 统计 数据 : 一 种 是 你 查阅 的 ; 一 种 是 你 创造 的 。 

Archie Goodwin” 
表 15-7 总 结 了 我 的 实验 结 末 。 单 元 内 的 “+” 表 示 优 秀 ,，“- ”表示 落后 。 表 里 面 的 数据 有 局 

限 性 。 首 先 ， 指 标的 权重 还 是 根据 它们 的 重要 性 校准 的 。 此 外 ， 指 标 是 不 是 和 功能 无 关 ， 这 一 点 

也 不 清楚 ， 或 者 说 他 们 是 人 否 完 整地 或 是 人 很 有 代表 性 地 体现 了 C 代 码 质 量 情况 ， 也 不 古 很 清楚 。 最 

后 ， 我 主观 地 加 入 了 +/- ， 和 硕 户 能 请 楚 地 指出 几 个 指标 里 不 同系 统 的 结 东 。 


表 15-7 ”结果 总 ; 

指 标 FreeBSD Linux Solaris WRK 
文件 组 织 
C 文 件 长 度 5 z 
头 文件 长 度 十 — 
C 文 件 中 的 全 局 函数 = = 
头 文件 中 的 定义 结构 = 
目录 结构 + 
每 个 目录 中 文件 的 个 数 = 
每 个 C 源 文件 的 头 文 件数 量 
平均 文件 中 的 结构 复杂 度 一 十 
代码 结构 
扩展 圈 复 杂 度 + _ 
每 个 国 数 的 语句 数 
Halstead 4g 24 EE + _ 
文件 级 耦合 
全 局 耦合 
全 局 国 数 百分比 — 
严格 结构 的 函数 百分比 = + 
带 有 标签 的 语句 百分比 = + 
函数 参数 平均 数量 
PIIRK ERR SE = = 
每 条 语句 中 的 单词 数 
































@ Archie Goodwin， 虚 构 小 说 中 人 物 。 此 名 话 出 自 侦探 小 说 家 Rex Stout 的 小 说 Death of a Doxy (1996 ) 。 一 一 译 者 注 1 
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指 标 FreeBSD Linux Solaris WRK 
重复 代码 中 的 标记 数目 一 一 
国 数 中 的 评价 结构 复杂 度 + = 
代码 风格 
全 局 标识 符 长 度 
聚合 标识 符 长 度 
对 章 行 数 百分比 $ 
typedef 对 齐 百 分 比 = E 
聚合 对 齐 百 分 比 z 一 一 
每 行 的 字符 数 
操作 数 中 的 数值 常量 百分比 一 $ $ 
不 安全 类 函数 宏 百 分 比 一 
C 文 件 中 的 注释 密度 = 
头 文件 中 的 注释 密度 = 
注释 中 的 拼写 错误 百分比 
注释 中 独特 的 拼写 错误 百分比 
预 处 理 
国 数 中 预 处 理 扩张 = + 
文件 级 预 处 理 扩 张 = 一 
头 文件 中 的 预 处 理 指 令 百 分 比 一 一 $ 
头 文件 中 非 _ 妇 nclude 的 指令 百分比 = 
函数 中 的 预 处 理 絮 命令 百分比 = 
函数 中 的 预 处 理 条 件 百 分 比 = 
JE SL ERI BLAZE PRIA Zo EL + 一 
单独 标识 符 中 的 宏 百 分 比 = 
标识 符 中 的 宏 百 分 比 = 
数据 组 织 
文件 中 命名 污染 平均 水 平 一 
全 局 变量 百分比 + 一 
全 局 操作 数 百 分 比 = T 
背 误 的 全 局 标识 符 百 分 比 7 一 
文件 内 变量 百分比 十 - 
文件 内 操作 数 百分比 $ - 
每 个 typedef 或 是 聚合 中 的 变量 一 


每 个 聚合 或 是 枚 举 的 数据 元 素 7 








+ + + + 


+ + + 


+ 
+ 














PRT, OW eric ARRO, BT AT Ae E SAS Ve. MIE 
的 详细 列表 和 表 15-7 中 ， 我 发 现 了 一 个 有 趣 的 现象 ， 就 症 系 统 之 间 不 同 值 的 相似 性 。 在 各 个 领域 
和 许多 不 同 的 指标 中 ， 四 个 有 很 大 不 同 开 发 流程 的 系统 的 得 分 古 相 似 的。 最 起 码 ， 这 个 结 末 可 以 
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说 明 一 个 庞大 而 复杂 软件 构件 的 结构 和 内 部 质量 , 首先 代表 的 是 艰巨 的 工程 建设 需求 , 而 流程 的 
影响 最 多 也 只 是 边缘 化 的 。 如 果 你 打算 建立 一 个 真实 世界 的 操作 系统 ,汽车 的 电子 控制 单元 ， 空 
中 交通 管制 系统 , 或 火星 着 陆 探测 器 上 的 软件 , 不 管 你 是 管理 一 个 专 有 软件 开发 团队 或 运行 一 个 
开源 项 目 : 你 不 能 忽视 质量 。 这 并 不 意味 着 流程 是 无 关 紧要 的 , 但 它 确实 意味 着 与 需求 兼容 的 流 
程 会 产生 大 致 相似 的 结果 。 在 建筑 领域 的 这 一 现象 被 称 做 “形式 追随 功能 ”1。 

你 也 可 以 从 某 些 部 分 的 集中 情况 得 出 有 趣 的 结论 。Linux 代 码 结构 的 各 种 指标 都 不 错 ， 但 在 
代码 风格 上 落后 。 这 可 能 是 由 于 聪明 而 又 积极 地 程序 员 谁 都 没有 注重 代码 风格 的 细节 。 与 此 相反 ， 
WRK 在 代码 风格 中 的 高 得 分 ， 代 码 结构 得 分 低 ， 却 可 能 是 因为 太 过 注重 细节 ， 却 没有 充分 自由 
地 发 挥 创造 力 去 发 展 技术 、 设 计 模式 和 工具 来 克服 大 规模 软件 的 复杂 度 。 

OpenSolaris 在 预 处 理 方面 的 得 分 领先 可 能 是 因为 它 的 编程 规范 。 使 用 预 处 理 器 的 问题 很 明 
显 , 但 是 诱惑 也 很 大 。 比 如 说 使 用 预 处 理 器 来 构造 域 相关 的 编程 构架 是 很 方便 的 。 使 用 预 处 理 器 
也 很 容易 为 不 同 的 平台 设 定 不 同 的 编译 命令 , 解决 了 可 移植 性 问题 。 但 长 期 来 看 , 这 些 都 有 问题 。 
我 们 可 以 假设 像 Sun 这 样 的 公司 是 不 鼓励 程序 员 用 预 处 理 器 的 。 

还 有 一 个 有 趣 的 现象 表现 在 FreeBSD 在 预 处 理 方面 的 不 良 表现 。 这 可 能 是 因为 狂热 的 
FreeBSD 开 发 者 认为 读 代码 的 人 都 是 开发 人 员 或 者 至 少 跟 写 代码 的 人 一 样 聪明 。 不 过 ，FreeBSD 
命名 空间 污染 较 少 ， 也 许 也 是 因为 使 用 预 处 理 器 建立 了 保守 的 数据 结构 访问 权限 。 

尽管 人 们 对 于 开放 式 或 封闭 源 代码 的 开发 效率 意见 并 不 统一 , 但 从 我 们 的 实验 结果 来 开 , 并 
没有 明显 的 获胜 者 或 是 失败 者 。 具 有 商用 血统 的 OpenSolaris 各 方面 的 得 分 比较 均衡 。WRK 负 面 
的 得 分 最 高 ，OpenSolaris 正 面 得 分 位 于 倒数 第 二 位 。 开 源 的 操作 系统 中 ， 虽 然 FreeBSD 人 负面 得 分 
最 高 ， 正 面 得 分 最 低 ， 但 是 Linux 在 正面 得 分 中 处 于 第 二 位 。 我 们 从 中 最 能 得 出 的 结论 就 是 : 开 
源 的 开发 方式 得 到 的 代码 并 不 比 专 有 软件 的 开发 方式 得 到 的 代码 质量 高 。 
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Robert DeLine 








由 于 大 众 文化 的 演 染 , OLA A EE I BOE) BI Dp ZS E PAE EADAE 
果子 ， 就 像 漫 画 《 呆 伯 特 》 的 主角 Dilbert 和 Wally， 或 者 英 剧 《IT 狂人 》(77ze77 Crowd) 中 的 Roy 
和 Moss 那 样 。 有 了 这 种 印象 之 后 ， 人 们 就 会 觉得 这 些 极 客 们 只 有 讨论 柯 克 和 皮卡 尔 "到底 谁 更 优 
秀 的 时 候 才 会 开口 。 

可 真实 的 情况 并 非 如 此 ， 很 多 程序 员 都 会 花 上 很 大 一 部 分 的 时 间 离 开办 公寓 相互 聊天 交流 。 
在 这 一 章 中 ,我 们 将 介绍 数 个 关于 程序 员 如 何 安 排 工 作 时 间 的 研究 ， 并 将 看 到 ， 交流 是 程序 员工 
作 的 主要 组 成 部 分 。 这 里 的 交流 并 不 是 在 饮水 机 旁边 站 着 办 聊 , 而 是 帮助 程序 员 们 相互 交谈 以 了 
解 项 目 当 前 的 状况 、 进 行 协 调 活 动 以 及 相互 分 享 知 识 的 必要 手段。 我 们 不 应 该 把 这 类 交流 看 做 妨 
但 团队 运作 的 绊脚石 ， 反 倒是 应 该 将 其 看 成 是 保证 团队 平稳 工作 的 润 请 剂 。 


16.1 程序 员 的 一 天 


那么 ， 普 通 程 序 员 们 每 天 古 如 何 安排 目 己 的 工作 时 则 的 呢 ， 我 们 又 如 何 知道 呢 ? 

从 很 早 以 前 开始 , 学 者 们 就 一 直 在 研究 工人 们 如 何 分 配 时 间 并 加 以 改善 , 这 已 经 成 为 了 一 种 
传统 。20 世 纪 初 的 时 候 , {Frank Gilbreth 和 Lillian Gilbreth 这 样 的 前 沿 研 究 者 就 已 经 由 于 写 了 《 儿 
女 一 黎 俊 》 而 声名 大 振 ， 他 们 介绍 了 一 种 “时 间 与 动作 研究 ”的 方法 ， 用 于 降低 工厂 工人 以 及 办 
公 室 人 员 在 执行 重复 任务 时 所 需要 人 花 的 时 间 和 精力 。 使 用 这 种 方法 的 研究 人 员 将 配备 秒表 、 写 字 
板 和 摄像 尖 ， 并 对 工人 的 正 第 工作 活动 进行 观 肾 。 人 研究 人 员 会 记录 下 每 个 里 体 动作 的 时 间 ， 并 看 
能 不 能 找 出 一 些 更 快 、 更 准确 和 更 轻松 的 新 的 动作 来 代 蔡 。 例 如 Gilbreths 发 现 外 科 医 生 在 手术 的 
时 候 间 毅 会 去 摸索 寻找 手术 工具 ,然后 发 明了 我 们 现在 熟知 的 规矩 ,， 即 外 科 医 生 需 要 工具 的 时 候 
就 让 助理 护士 来 传递 。 这 样 的 创新 不 但 缩短 了 手术 的 时 间 ， 也 避免 了 很 多 错误 。 

当然 我 们 必须 看 到 , 软件 开发 和 工厂 以 及 手术 是 不 同 的 。 时 间 与 动作 人 研究 主要 关注 的 是 形体 
动作 ， 而 软件 开发 主要 徘 的 是 大 脑 。 不 过 ， 这 个 研究 方法 对 软件 开发 却 同 样 适用 。 

在 20 世 纪 90 年 代 初 期 , Perry、Staudenmayer 和 Votta 进 行 了 一 项 研究 ,使 用 的 方法 正 是 时 间 与 
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动作 研究 ， 对 象 是 一 组 实时 交换 系统 的 程序 员 ”。 由 于 当时 还 没有 一 套 成 文 的 方法 来 研究 程序 员 
的 工作 ， 所 以 他 们 尝试 了 两 种 不 同 的 方法 : 日 记 研究 和 观察 研究 。 


16.1.1 日 记 研 究 


首先 ,人 研究 人 员 们 要 求 参 与 者 们 在 一 年 内 每 天 填写 一 份 工作 日 记 , 记录 他 们 每 日 的 工作 活动 。 
工作 时 间 中 的 每 个 小 时 都 有 对 应 的 格子 , 在 这 些 格子 中 总 结 他 这 个 小 时 做 了 些 什 么 。 参 与 者 将 在 
每 个 格子 中 写 下 他 所 分 配 到 的 任务 类 型 CAO, ER, Beth. MRE). WN AHF 
没有 进行 任务 ,他 将 写 下 原因 (比如 说 ， 有 其 他 更 高 优先 级 的 任务 、 必 须 的 资源 不 可 用 所 以 等 待 
或 者 个 人 选择 做 其 他 事情 等 )。 出 乎 意料 的 是 ，4 个 小 组 中 有 13 个 程序 员 都 愿 划 参与 这 个 实验 。 

基于 这 个 研究 的 数据 ,他 们 得 出 的 最 重要 结论 是 参与 者 只 伦 了 约 40% 的 时 间 来 进行 分 配 到 的 
任务 。 在 剩 下 的 时 间 中 他 们 要 么 就 在 等 待 , 要 么 就 在 做 其 他 事情 。 人 研究 人 员 们 注意 到 ， 由 于 第 闸 
会 被 旭 等 待 ， 程 序 员 们 一 般 都 会 保证 手 上 同时 有 两 件 工作 。 这 样 的 话 ， 如 采 进 行 一 个 任务 受阻 等 
待 的 上 时候， 他 们 就 可 以 切换 到 为 外 一 项 任务 上 去 。 

当然 ， 由 于 参与 者 是 目 己 记录 目 己 的 时 间 使 用 情况 ， 所 以 这 样 的 日 记 可 能 并 不 会 特别 准确 。 
虽然 我 们 可 以 假设 每 个 参与 者 都 敬业 地 在 每 个 小 时 的 整 点 时 刻 填 写 日 记 , 但 是 用 小 时 作为 单位 也 
古 非 第 粗略 的 一 一 一 个 小 时 之 内 可 能 发 生 的 事情 太 多 了 1 所 以 , 为 了 核 得 日 记 的 准确 性 并 挖掘 更 
详细 的 数据 ,研究 人 员 又 进行 了 第 二 次 研究 ,在 这 次 研究 中 ,他 们 将 跟踪 观察 程序 员 们 并 记录 下 
他 们 的 时 间 使 用 情况 。 

















16.1.2 ”观察 研究 


在 第 二 次 研究 中 ， 三 位 研究 员 直 接 观 罕 了 5 个 参与 者 的 日 第 工作 。 在 工作 时 间 中 ， 他 们 一 直 
跟随 着 这 些 程 序 员 , 一 般 每 天 8 到 10 个 小 时 ,每 人 分 别 观察 了 5 天 ， 共 获得 了 多 达 300 小 时 的 数据 。 
在 受 观 察 期 间 , 研究 人 员 要 求 伞 观察 者 把 上 自己 当做 一 个 实习 的 学 生 。 在 研究 人 员 看 不 明白 程序 员 
正在 做 的 事情 的 时 候 ， 他 们 就 会 主动 问 问题 ， 比 如 “你 现在 在 做 什么 2 ”“。 这 样 的 观察 数据 比 
起 日 记 来 说 要 仔细 得 多 ， 时 间 的 单位 也 精细 到 了 3 分 钟 。 

从 观察 的 数据 来 看 , 程序 员 每 天 大 概 会 花 75 分 钟 的 时 间 来 进行 非 正 式 的 沟通 ,沟通 方式 则 是 
email、 电 话 、 语 音 邮 件 或 者 面对面 的 谈话 。 这 75 分 钟 并 不 包含 在 定期 的 设计 评审 、 代 码 评审 、 
内 部 通气 会 等 会 议 中 ， 很 明显 这 些 会 议 也 将 包括 很 多 的 沟通 。 除 了 邮件 列表 中 的 广播 信息 之 外 ， 
最 第 见 的 沟通 方式 是 面对面 地 谈话 , 这 种 方式 的 频率 是 其 他 方式 的 两 到 三 倍 。 程序 员 们 每 天 平均 
会 跟 7 个 不 同 的 人 人 说话。 在 人 钱 究 中 发 现 谈话 对 象 数量 最 多 的 是 17 人 。 这 些 交 流 一 般 比 较 短 ， 其 中 
68% 都 少 于 5 分 钟 ， 但 十 超过 半 小 时 的 电话 或 者 长 太一 小 时 的 面对面 交谈 也 不 罕见 。 很 明显 ,说 
了 不 少 话 啊 ] 


16.1.3 ”程序 员 们 是 不 是 在 挣 表现 
如 末 我 们 天 真 地 以 为 程序 员 们 只 有 在 襄 键 盘 的 时 候 才 能 出 成 绩 , 那么 这 些 结果 可 能 看 起 来 很 
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和 危险。 毕竟 ,研究 表明 程序 员 们 大 部 分 的 时 间 都 不 是 花 在 任务 上 ， 而 其 中 很 大 一 部 分 是 用 来 和 其 
他 程序 员 们 交谈 。 我 们 可 能 会 问 这 些 研究 是 不 是 哪里 出 了 错 。 

有 种 说 法 是 日 记 研究 法 太 依 赖 自我 汇报 的 数据 了 。 为 了 解决 这 个 问题 , 研究 人 员 们 使 用 了 日 
记 和 观察 两 种 方法 。 所 以 说 ,有 很 多 天 的 数据 既 包 括 了 自我 汇报 的 日 记 又 有 研究 人 员 的 观察 数据 。 
也 许 你 已 经 想到 了 , 程序 员 们 对 任务 时 间 的 估算 有 差别 , 有 时 候 会 多 汇报 有 时 候 会 少 汇报 。 但 是 ， 
差距 一 般 不 会 很 大 : 平均 只 有 2.8% 的 时 间 是 多 汇报 的 。 在 很 多 情况 下 ,， 少 回报 的 原因 都 是 因为 干 
扰 和 等 待 而 忽略 了 时 间 。 

当然 ,我 们 还 可 以 怀疑 观察 到 的 数据 。 由 于 研究 人 员 会 一 直 注 视 着 程序 员 们 ， 我 们 可 能 
觉 程序 员 们 是 在 观察 期 间 “ 做 样子 ， 甚 至 “ 挣 表现 ”。 实 际 上 ， 这 种 现象 在 实验 心理 学 中 砷 
见 ， 称 之 为 : ERI 

在 20 世 纪 20 年 代 后 期 , 研究 人 员 在 位 于 芝加哥 的 堆 桑 电子 工厂 做 了 一 些 实验 ,， 想 要 看 看 改善 
车 间 照 明 能 不 能 提高 工人 的 效率 。 在 儿 个 星期 的 时 间 里 ， 他们 尝试 了 多 种 不 同 的 照明 水 平 。 有趣 
的 是 ,无论 他 们 对 照明 的 调整 再 小 ， 工 人 的 效率 都 会 提高 ! 但 是 研究 一 结束 ， 效 率 就 立刻 恢复 到 
原来 的 水 平 了 。 这 些 实验 有 一 个 共同 点 , 那 就 是 工人 们 都 知道 自己 是 实验 对 象 ,今天 , RH E 
又 效应 ”来 指 当 被 观察 者 知道 自己 是 研究 对 象 的 时 候 ， 会 改善 自己 的 行为 的 现象 。 

那么 ， 这 个 研究 中 的 参与 者 们 是 否 收 到 了 霍 桑 效应 的 影响 呢 ” 由 于 这 个 影响 是 不 可 避免 的 ， 
所 以 答案 是 肯定 的 ,不 同 的 只 是 影响 的 程度 问题 。 所 以 ， 我 们 更 应 该 问 : 霍 桑 效应 在 多 大 程度 上 
影响 了 观测 数据 的 准确 性 ? 由 于 研究 人 员 们 知道 这 个 效应 , 所 以 他 们 在 设计 研究 的 时 候 就 考虑 了 
如 何 来 减轻 它 的 影响 。 首 先 ,在 日 记 研 究 中 的 很 多 参与 者 并 没有 参与 观察 研究 ， 这 样 他 们 就 可 以 
知道 被 观察 的 程序 员 和 疫 被 观察 的 程序 员 有 什么 不 同 。 其 次 ,观察 日 期 并 不 是 提前 安排 好 的 。 由 
于 研究 人 员 每 天 都 可 能 出 现 ， 程 序 员 们 就 无 法 故意 把 自己 的 工作 安排 得 “很 有 趣 ” 以 应 对 观察 。 
在 这 次 研究 中 ， 随 机 选择 和 事先 安排 的 差距 并 不 大 。 最 后 ， 在 两 次 研究 中 ， 数 据 都 是 完全 匿名 
的 ， 这 样 就 降低 了 程序 员 们 “ 挣 表现 ”的 可 能 性 ， 因 为 他 们 的 同事 、 经 理 和 其 他 人 无 法 得 知 他 
们 的 结果 。 


16.2 说 这 么 多 有 什么 意义 


由 于 程序 员 们 很 大 一 部 分 的 工作 时 间 都 花 在 了 谈话 上， 你 可 能 会 在 想 他 们 到 底 在 谈 些 什么 ， 
我 和 我 的 同事 们 最 近 在 微软 公司 进行 的 两 次 研究 对 这 个 问题 进行 了 一 些 探索 。 通 过 问卷 调查 、 访 
谈 和 直接 观察 的 方式 , 我 们 了 解 到 ,大 部 分 的 谈话 都 是 在 寻找 信息 一 即 为 编程 任务 相关 的 问题 
寻求 答案 。 这 些 研究 使 我 们 了 解 了 很 多 程序 员 偏 好 面对面 交谈 的 原因 ， 还 让 我 们 知道 了 最 容易 出 


现 的 问题 究竟 是 什么 。 
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16.2.1 问 占 题 


在 2006 年 开始 的 第 一 项 研究 中 ， 我 们 随机 抽取 了 157 名 程序 员 进行 问卷 调查 ， 并 随后 对 他 们 
中 的 11 人 进行 了 访谈 。 我 们 询问 了 他 们 的 日 常 工 作 话 动 ， 尤 其 是 他 们 认为 最 困难 的 工作 。 他 们 
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关于 时 间 分 配 的 反馈 和 Perry 等 人 的 研究 一 致 ,化 在 沟通 上 的 时 间 的 平均 比率 要 比 其 他 任何 活动 郡 
要 高 。 问卷 调查 还 要 求 受 访 者 估计 他 们 使 用 各 种 沟通 方式 的 时 间 比 率 , 并 按照 他 们 的 想法 对 这 些 
沟通 方式 的 效率 进行 评价 。 结 末 如 图 16-1 所 示 。 这 些 结 琳 仍 然 和 Perry 等 人 的 研究 一 致 ， 受 访 者 大 
部 分 的 时 间 仍 花 在 即兴 的 面对面 谈话 上 。 他 们 也 将 面对面 交流 评 为 最 有 效 的 沟通 方式 。 
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在 访谈 中 ,我 们 询问 了 他 们 在 日 第 工作 中 会 碰 到 哪些 难题 。 他 们 都 有 一 个 共同 的 难题 ， 那 就 
是 第 第 会 因为 缺少 一 些 必需 的 信息 而 不 得 不 卡 在 哪里 。 他 们 通 和 认为 军 过 走廊 来 和 同事 交谈 不 但 
效率 高 ， 而 且 有 时 要 想 获得 信息 就 只 能 徘 这 个 办 法 。 

下 面 这 个 故事 取 自 我 们 的 访谈 之 一 (参见 参考 文献 [和 )， 它 说 明了 在 调试 环 市 中 ， 沟通 也 是 
编程 活动 的 重要 组 成 部 分 。 











这 个 开发 人 员 通 过 bug 跟 中 工具 中 得 到 了 一 个 bug, 他 重 现 了 这 个 错误 , 打开 了 某 个 
网 址 ,并 确保 这 个 网 址 如 bug 报 告 所 称 会 报 “500 - Internal Error” 错误 。 然 后 ,他 将 Visual 
Studio 的 调试 器 连接 到 Web 服 务 器 ,并 设置 为 出 现 异 常 即 暂停 的 状态 ,并 在 此 重 现 错误 ， 
然后 Visual Studio 告 诉 他 问题 是 空 指针 异常 。 在 查看 了 调用 栈 窗 口 之 后 ， 他 认为 某 个 池 
数 可 能 在 生成 错误 的 值 。 他 用 Emacs 打 开 了 这 个 济 数 ， 并 使 用 了 ctags.exe 浏 览 这 个 池 数 
的 调用 者 。 然 后 ， 他 转 回 了 Visual Studio 的 调试 器 ， 并 改变 了 运行 时 的 值 ， 看 看 有 什么 
效果 。 他 做 了 修改 ， 并 重新 编译 ， 然 后 发 现 错误 还 在 。 最 后 ， 他 进一步 浏览 了 调用 栈 ， 
发 现 错误 的 值 都 是 由 一 个 对 象 生 成 的 ,然后 他 又 发 现 了 另 一 个 对 象 ， 最 后 发 现 了 第 三 个 
具备 互 斤 保护 的 对 象 。 

而 这 个 时 候 ， 他 不 得 不 去 查看 并 不 “属于 ”他 或 者 由 他 来 维护 的 代码 , 但 是 看 不 明 
白 。 男 一 个 开发 人 员 在 开发 某 个 功能 的 时 候 修 改过 代码 ,而 他 知道 这 个 开发 人 员 应 该 能 
看 懂 这 些 代 码 。 然 后 他 到 了 这 个 开发 人 员 的 办 公 室 , 打 断 那个 开发 人 人员， 两 人 开始 讨论 
这 段 代码 的 设计 思路 。 

随后 他 返回 了 自己 的 办 公 室 ,并 根据 得 到 的 信息 作出 了 修改 ,， 却 发 现 修改 无 效 ， 这 
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下 老 问题 没 解决 , 他 又 在 这 段 不 属于 他 的 代码 中 发 现 了 新 问题 。 他 又 到 了 那个 开发 人 员 
的 办 公 室 ， 这 个 开发 人 员 告 诉 他 造成 问题 的 功能 实际 上 是 由 第 三 个 开发 人 员 来 负责 的 。 
他 们 一 起 到 了 第 三 个 开发 人 员 的 办 公 室 ,但 是 他 去 吃 年 饭 了 。 第 一 个 开发 人 员 由 于 无 法 
继续 这 个 任务 ,所 以 开始 进行 另 一 个 任务 。 午 饭 之 后 ， 两 个 开发 人 员 又 重新 到 了 第 三 个 
开发 人 员 的 办 公 室 ,然后 讨论 了 功能 的 正确 行为 ,并 最 终 把 第 一 个 开发 人 员 的 问题 交 给 
了 第 三 个 开发 人 员 进 行 修复 。 


这 个 故事 充分 地 展现 了 我 们 在 访谈 中 多 次 昕 到 的 问题 。 当 程序 员 被 困 在 杀 个 他 不 明白 的 问题 
上 时 ， 他 就 会 完 做 一 些 “ 份 内 的 事 "， 再 问 同 事 帮 忙 。 也 就 是 说 ， 他 会 先 花 时 间 了 解 代码 ， 以 免 
问 出 太 不 靠 谱 的 问题 。 在 面谈 之 后 ， 我 们 又 组 织 了 一 次 有 187 个 程序 员 参 加 的 后 续 问 卷 调查 ， 以 
便 能 了 解 更 多 关于 这 个 “ 份 内 事 ” 的 信息 “。 在 这 次 调查 中 , 我 们 发 现在 做 “ 份 内 事 ” 的 过 程 中 ， 
受 访 者 平均 会 花 42% 的 时 间 来 分 析 源 代码 ，20% 的 时 间 来 使 用 编译 颖 ，16% 的 时 间 来 分 析 提 交 注 
释 和 版 本 比较 ，9% 的 时 候 来 分 析 结 果 ，8% 的 时 间 来 使 用 调试 和 跟踪 语句 以 及 5% 的 时 间 使 用 其 他 
Te 








16.2.2 ”探寻 设计 理念 


一 般 来 说 ， 仅 仅 分 析 代 码 及 其 行为 并 不 能 透彻 理解 它 的 意义 。 在 前 一 攻 提 到 的 故事 中 ， 受 访 
的 程序 员 在 同事 那里 学 习 了 代码 背后 的 设计 理念 一 一 这 样 的 信息 通 弟 是 没有 记录 有 的 , 只 存在 于 团 
队 的 集体 记忆 之 中 。 正 如 茶 位 受 访 程序 员 所 说 的 那样 : “很 多 设计 信息 ， 都 证 在 人 们 的 大 脑 中 保 
存 着 的 。 实际 上 ， 在 我 们 第 一 次 调查 中 ,， “了解 代码 的 设计 理念 ”是 排名 最 高 的 问题 ， 有 66% 的 
人 都 认为 他 们 遇 到 了 这 个 困难 。 

那么 到 克 “ 设 计 理 念 eT ARE? 在 后 续 回 卷 调 查 中 ,我 们 询问 受 访 者 要 了 解 哪 方 面 的 设 
计 理 念 最 为 困难 。 在 187 个 受 访 者 中 ， 有 82% 认 为 最 难 理解 的 是 “为 什么 代码 是 按 这 种 方式 来 实 
现 的 "， 有 73% 的 人 认为 最 难 的 是 “是 否 这 段 代码 只 是 暂时 的 解决 方案 ， 有 69% 认 为 是 “代码 古 
如 何 工 作 的 "， 有 62% 认 为 是 “这 上段 代码 想 要 完成 什么 功能 。 也 如 是 说， 设计 理念 就 是 代码 “ 育 
后 的 故事 "， 有 时 候 古 关于 为 什么 这 样 写 ， 有 时 候 古 关于 为 什么 做 出 这 样 的 取舍 。 


16.2.3 ”工作 的 中 断 和 多 任务 


再 回 到 我 们 的 访谈 故事 。 当 这 个 程序 员 遇 到 设计 理念 问题 的 时 候 ， 他 罕 过 走 原 找 同事 面谈 ， 
先 找 了 一 个 , 后 来 又 找 了 男 一 个 。 这 样 的 选择 和 我 们 在 图 16-1 中 所 示 的 沟通 偏好 以 及 Perry 竺 人 的 
观察 一 致 。 问 题 征 ， 每 次 即兴 的 面谈 都 至 少 会 让 一 个 人 中 断 他 的 工作 。 工 作 的 中 断 又 会 造成 任务 
的 切换 。 比 如 说 ,被 中 断 的 人 可 能 会 停止 写 代 码 ， 并 开始 为 提问 的 人 寻找 答案 。 在 我 们 的 问卷 调 
查 中 ， 排 名 第 二 的 问题 是 “由 于 队友 或 者 管理 者 的 请 求 而 不 得 不 切换 任务 "， 共 有 62% 的 受 访 者 
认为 这 是 个 难题 。 

在 故事 中 我 们 还 看 到 这 个 程序 员 在 第 一 次 尝试 时 曾 受 阻 ， 因为 他 的 同事 不 在 。 结 末 就 是 ， 这 
个 程序 员 也 切换 了 任务 ， 以 免疫 事 做 。 随 后 ， 当 那个 同事 回来 的 时 候 ， 他 们 一 起 继续 进行 了 原来 
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的 任务 ， 即 确定 了 程序 的 正 第 行 为 以 及 谁 负 贡 实 现 。Perry 等 人 也 观 罕 到 了 同样 的 任务 切换 行为 。 
对 于 被 中 断 的 人 来 说 ,这样 的 面谈 就 意味 着 效率 的 流失 , 但 是 对 于 问 问 题 的 人 来 说 ， 如 琳 想 要 保 
挂 高效， 这样 的 面谈 却 古 必 不 可 少 的 。 

总 的 来 说 ， 当 程序 员 们 执行 任务 的 时 候 ， 第 第 会 出 现 各 种 回 题 。 当 他 们 “恪尽职守 ”地 翻阅 
代码 却 仍 无 法 找 出 答 生 的 时 候 , 他 们 第 第 会 去 问 同事 ,这 些 问 题 中 最 难 解 决 的 是 设计 理念 的 问题 。 
这 种 问题 的 答案 第 党 只 存在 于 “人 的 大 脑 中 "。 但 是 设计 理念 十 不 古 唯一 的 问题 呢 ? 在 程序 员工 
作 的 时 候 还 会 遇 到 什么 其 他 的 回 题 呢 ? 





16.2.4 程序 员 都 在 问 什 么 问题 


为 了 了 解 程序 员 们 在 日 常 工作 中 会 问 的 问题 ， 我 们 又 在 微软 公司 做 了 第 二 次 研究 ， 使 用 了 
一 套 和 Perry 等 人 使 用 的 观察 研究 法 非常 相似 的 方法 。 我 们 观察 了 17 个 程序 员 的 日 稍 工 作 , 每 人 90 
分 钟 。 就 像 Perry 等 人 那样 , 我 们 也 要 求 程序 员 把 我 们 当 作 实习 的 学 生 ， 可 以 在 不 明白 他 们 在 做 什 
么 的 时 候 问 问题 。 

我 们 还 使 用 了 心理 学 家 和 社会 学 家 们 所 谓 的 “ 想 出 再 来 ”(think-aloud) 的 方法 。 也 就 是 说 ， 
要 求 程序 员 不 断 地 跟 我 们 说 话 ， 说 出 他 们 的 每 个 想法 ， 并 描述 在 进行 的 每 个 动作 。 下 面 是 一 个 虚 
构 的 例子 。 

好 吧 ， 我 正在 找 打 开 数 据 库 的 代码 ， 所 以 我 按 了 Ctrl-F 来 打开 搜索 框 。 我 正 输入 

“open”, 该死, 哈 也 没有 。 我 再 试 试 database ,好 了 ,我 找到 代码 了 。, 它 被 称 之 为 “access 

database”, RÆ “open”, MARTIRI, 

虽然 这 样 的 磅 雁 念 看 起 来 好 像 有 点 令 人 不 舒服 ,有 时 黄 至 让 人 讨厌 , 但 是 参与 者 们 很 快 就 适 
应 了 。 如 采 没 有 “ 想 出 声 来 ”的 办 法 ， 我 们 就 不 可 能 理解 程序 员 的 精神 状态 ， 更 无 从 了 解 他 们 稼 
第 在 疑惑 的 问题 。 

参与 者 就 这 样 不 断 地 说 着 , 而 我 们 则 会 用 一 个 小 的 数字 显示 式 时 钟 和 一 个 笔记 本 记 下 他 们 在 
每 分 钟 里 说 过 的 所 有 话 和 做 过 的 所 有 事情 。 当 他 们 离开 座位 去 问 同事 问题 的 时 候 ,， 我 们 也 跟着 并 
记录 下 整个 对 话 。 记 下 了 这 些 数据 之 后 ， 我 们 又 对 它们 进行 了 分 析 和 分 类 ， 如 表 16-1 所 示 。 


表 16-1 实验 观察 到 的 程序 员 需 求 ， 按 频率 排列 





























信息 类 型 持续 时 间 频率 及 寻找 的 结果 
平均 ”最 多 找到 图 推迟 口 放弃 多 未 观察 到 - 
TTT 
ENNEA O OOOO 

是 什么 代码 导致 了 这 个 程序 状态 2 21 SECO - 
在 什么 情况 下 会 出 现 这 个 错误 2 49 SEER - 
这 个 程序 本 来 是 做 什么 的 l 21 T T a a 
别人 对 我 所 依赖 的 资源 进行 了 哪些 变动 l 9 ë EERRNEENENENENNENEN O O OOX 
什么 代码 可 能 造成 了 这 个 行为 2 17 [PSX - 
我 如 何 来 使 用 这 个 数据 结构 (或 者 函数 ) l | x 











( 续 ) 
信息 类 型 持续 时 间 频率 及 寻找 的 结果 
平均 ”最 多 找到 上 推迟 口 放弃 多 未 观察 到 - 
这 个 代码 为 什么 是 这 样 实现 的 2 21 smmmecoooooom-- - - - 
这 个 问题 是 否 值得 修复 2 6 PT TT TT Tt tt oe 
这 样 修改 会 造成 什么 影响 2 9 SE EEE000000000 
这 段 代 码 的 目的 是 什么 ] 5 EEEEEEEEEO X 
这 个 代码 和 哪些 代码 有 静态 关联 l 7 SERRE 
这 算 不 算 一 个 问题 l 2 SEED 
我 有 疫 有 遵守 团队 的 惯例 7 2 seco 
这 个 故障 应 该 是 什么 样子 0 2 S==nn 
这 次 提交 包含 哪些 修改 2 3 | | 
我 如 何 协调 这 段 代 码 和 其 他 代码 l 4 BBX- 
这 个 问题 有 多 难 解决 2 4 EEE 
我 们 有 哪些 选择 来 实现 这 个 程序 行为 2 2 == 
哪些 信息 与 我 的 任务 相关 l 1 ao 





表 中 的 信息 是 我 们 从 听 到 的 具体 问题 中 概括 出 来 的 。 对 于 每 种 信息 需求 ,我 们 还 将 展示 两 类 
AA. Wc, 持续 时 间 ” 栏 展示 了 我 们 观察 到 的 程序 员 寻 求 这 个 信息 需求 答案 的 平均 和 最 多 分 
钟 数 。 其 次 ,， “频率 和 结 末 栏 ”中 的 每 个 符号 则 代表 我 们 观察 到 的 一 次 信息 需求 :， 黑 方 框 意 味 着 
成 功 找 到 答案 ， 白 方 框 意味 着 推 后 了 一 段 时 间 ， 带 X 的 盒子 意味 着 放弃 寻找 ， 而 短 横 线 则 代表 结 
果 未 知 (因为 在 问题 解决 之 前 观察 的 时 间 就 到 了 )。 

程序 员 在 哪里 找 答 案 ? 表 16-2 展 示 了 我 们 观察 到 的 程序 员 的 信息 来 源 。 和 前 面 的 研究 结果 一 
致 ， 程 序 员 们 最 常 询问 同事 (coworker) 以 获得 信息 。 而 其 他 的 信息 来 源 ， 按 照 最 常用 到 最 少 用 
排列 分 别 是 : 

(1) 各 种 团队 或 者 公司 专用 的 工具 (tool); 

(2) 程序 员 自 己 的 直觉 、 逻 辑 推 论 或 者 记忆 (brain)，; 

(3) Bug 数 据 库 (bug); 

(4) 调试 器 (dbug); 

(5) 源 代码 、 其 注释 或 者 历史 (code), 

(6) 除了 规格 文档 之 外 的 文档 (docs) ; 

(7) Email; 

(8) 规格 文档 (specs) ; 

(9) 程序 执行 的 日 志文 件 (log) ; 

(10) 即时 通信 工具 (im). 

除了 调查 最 稼 见 的 问题 之 外 , 我 们 还 调查 了 最 让 人 痛 震 的 问题 ,也 就 是 那些 搜寻 答案 的 时 间 
最 长 或 者 没 能 解决 (推迟 或 者 放弃 了 ) 的 问题 。 根 据 这 个 标准 ， 最 让 人 痛 亩 的 7 大 信息 需求 分 别 
是 下 列 问 题 。 
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(1) 是 什么 代码 导致 了 这 个 程序 状态 ? (61% 未 解决 ， 最 多 21 分 钟 。) 
(2) 这 个 代码 为 什么 是 这 样 实现 的 ? (44% 未 解决 ， 最 多 21 分 钟 。) 

(3) 在 什么 情况 下 会 出 现 这 个 错误 ? (41% 未 解决 ， 最 多 49 分 钟 。) 

(4) 什么 代码 可 能 造成 了 这 个 行为 ? (36% 未 解决 ， 最 多 17 分 钟 。) 

(5) 别人 对 我 所 依赖 的 资源 进行 了 哪些 变动 ? (24% 未 解决 ， 最 多 9 分 钟 。) 

(6) 这 个 程序 本 来 是 做 什么 的 ? (15% 未 解决 ， 最 多 21 分 钟 。) 

(7) 我 的 同事 们 都 做 了 什么 ? (14% 未 解决 ， 最 多 11 分 钟 。) 

我 们 观察 到 ， 当 程序 员 迪 到 上 面 这 些 问 题 的 时 候 ， 都 去 问 了 同事 ， 但 是 也 利用 了 其 他 的 信息 
源 来 寻找 答案 〈 这 些 通 稍 是 他 们 “恪尽职守 ”的 一 部 分 )。 

所 以 , 除了 知道 开发 人 员 第 肖 相 互 问 问题 之 外 ,我们 还 知道 了 哪些 问题 问 得 最 多 ,哪些 问题 
最 难 解决 。 








表 16-2 程序 员 寻 求 答案 的 信息 来 源 的 使 用 频率 


coworker tool brain bug dbug code docs email specs log im 总 计 











我 的 同事 们 都 做 了 什么 20 8 13 2 43 
是 什么 代码 导致 了 这 个 程序 l 3 3 3 16 2 3 31 
状态 

这 个 程序 本 来 是 做 什么 的 9 5 l 13 28 
在 什么 情况 下 会 出 现 这 个 错误 8 3 5 8 2 l 27 
别人 对 我 所 依赖 的 资源 进行 0 12 2 l 4 25 
了 哪些 变动 

什么 代码 可 能 造成 了 这 个 行为 5 4 4 2 l l 4 1 22 
我 如 何 来 使 用 这 个 数据 结构 4 5 At l Ji 
(或 者 函数 ) 

这 个 代码 为 什么 是 这 样 实现 的 2 2 4 1 2 8 19 
这 个 问题 是 否 值得 修复 12 l l 2 16 
这 样 修改 会 造成 什么 影响 13 l 14 
这 段 代 码 的 目的 是 什么 2 5 2 2 1 l 13 
这 个 代码 和 哪些 代码 有 静态 8 Í 1 11 
关联 

这 算 不 算 一 个 问题 l 5 l 7 
我 有 没有 遵守 团队 的 惯例 2 l > 5 
这 个 故障 应 该 是 什么 样子 5 5 
这 次 提交 包含 哪些 修改 2 2 4 
我 如 何 协调 这 段 代 码 和 其 他 l l 2 4 
代码 

这 个 问题 有 多 难 解决 l 1 l 3 
我 们 有 哪些 选择 来 实现 这 个 l 1 2 
程序 行为 

哪些 信息 与 我 的 任务 相关 2 2 


总 数 83 42 30 30 24 22 22 21 16 9 3 
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16.2.5 ”使 用 敏捷 方法 是 不 是 更 利于 沟通 


我 们 前 面 摘 述 的 行为 来 自 两 份 研究 结 有 末 ， 一 份 是 在 20 世 纪 90 年 代 中 期 在 电话 公司 做 的 ， 另 
一 份 是 在 2000 年 年 中 在 微软 做 的 。 这 两 个 公司 的 产品 不 同 ， 开 发 工具 不 同 ， 而 且 由 于 中 间隔 了 
十 年 ， 他 们 使 用 的 沟通 工具 也 不 同 〈 比 如 ， 较 早 那 份 研 究 设 有 提 到 手机 和 即时 通信 )。 但 是 ， 两 
个 公司 都 是 使 用 同一 种 修改 过 的 传统 的 瀑布 开发 流程 ， 即 较 长 的 开发 周期 ， 以 及 各 个 阶段 划分 
清晰 ， 比 如 规划 、 写 规格 文档 、 编 写 代 码 、 测 试 、 发 布 等 。 如 果 团 队 采 用 了 敏捷 方法 , 沟通 的 行 
为 是 否 不 同 ? 

2006 年 ，Chong 和 Siino 研 究 了 两 家 位 于 旧金山 湾 区 的 创业 公司 中 敏捷 和 非 敏 捷 团 队 之 间 的 区 
别 趾 。 其 中 一 个 团队 (他 们 称 之 为 “单干 团队 ”) 使 用 传统 的 开发 方法 ， 所 有 程序 员 都 在 各 自 的 
隔 间 里 。 另 一 个 团队 (他们 称 之 为 “结对 团队 ”), 使 用 了 结对 编程 的 方法 ， 办 公 室 也 就 是 开放 式 
的 。 总 的 来 说 ， 他 们 观察 到 的 沟通 行为 和 电话 公司 以 及 微软 非常 相似 。 两 个 团队 中 的 程序 员 都 会 
经 和 党 徘 沟 通 来 寻求 帮助 、 寻 找 信 息 、 协 调 行动 或 者 共享 状态 。 不 过 ， 两 个 团队 的 沟通 性 质 有 所 不 
同 ， 因 为 开发 的 方式 和 工作 环境 不 同 。 

有 的 区 别 是 由 于 办 公 室 环境 的 物理 设置 造成 的 。 两 个 团队 都 有 很 大 的 工作 空间 ， 但 是 结对 
团队 是 公共 办 公 室 ， 而 单干 团队 采用 的 则 是 小 隔 间 。 由 于 结对 团队 的 环境 是 开放 式 的 ， 程 序 员 
们 可 以 听 到 相互 之 间 的 交谈 ， 有 时 候 只 靠 遍 扇 耳 边 风 就 能 获得 相关 的 信息 ， 而 且 还 可 以 随时 加 
入 谈话 。 因 为 有 这 个 优点 ， 所 以 结对 团队 往往 会 在 公开 的 环境 下 谈论 与 工作 相关 的 话题 。 正 好 
相反 的 是 ， 单 干 团队 总 是 试图 保持 工作 场合 的 安静 ， 因 为 噪 声 很 容易 就 会 穿 透 卡 座 影 响 到 其 他 
人 。 虽 然 大 家 都 尽量 保持 安静 ， 但 是 单干 团队 中 还 是 有 成 员 独 自在 家 工作 ， 以 避免 干扰 。( 在 
DeMarco 和 Lister 的 名 著 《 人 件 》 中 有 一 个 主要 的 主题 就 是 与 此 类 似 的 对 安静 工作 环境 的 需求 站, ) 
单干 团队 主要 依赖 聊天 系统 进行 沟通 ， 这 样 他 们 不 用 动 嘴 说 话 就 能 交换 信息 ， 还 可 以 和 在 家 工 
作 的 人 进行 沟通 。 

Chong 和 Siino 对 二 者 干扰 的 不 同 做 了 深入 研究 。 结 对 团队 的 干扰 时 间 总 是 比 单干 团队 短 ( 结 
对 平均 1 分 55 秒 ， 单 干 2 分 45 秒 )。 对 于 结对 编程 的 利用 也 影响 了 研究 结果 。 当 结对 团队 遇 到 问题 
的 时 候 , 通常 二 人 中 的 一 人 会 去 发 起 讨论 并 找 出 答案 , 而 留 下 另 一 个 人 继续 工作 。 此 外 ， 在 结对 
团队 中 ， 当 有 人 来 问 问题 的 时 候 ， 其 中 一 个 程序 员 会 直接 到 那个 提问 的 人 的 办 公 桌 去 进行 讨论 ，。 
这 意味 着 回答 问题 的 那个 程序 员 可 以 自己 决定 什么 时 候 回 答 完 毕 , 并 回 到 自己 的 办 公 桌 。 与 此 相 
反 的 是 ， 单 干 小 组 和 早 前 介绍 的 两 次 研究 一 样 ， 想 问 问 题 的 人 会 走 到 其 他 人 的 办 公 桌 去 问 问题 。 
这 样 的 话 ， 什 么 时 候 回 答 完毕 就 由 问 问 题 的 人 来 决定 了 。 

总 之 ， 这 次 研究 表明 在 某 些 层面 上 ， 敏 捷 方法 确实 可 以 提供 一 些 沟通 上 的 独特 优势 。 特 别 需 
要 注意 的 是 对 公共 办 公 室 的 使 用 , 这 种 办 公 室 的 安排 方法 通常 更 利于 信息 和 知识 的 传播 ， 因为 大 
家 可 以 随时 扁 耳 边 风 ,而且 这 样 的 安排 还 会 让 (至 少 是 公共 办 公 区 的 ) 程序 员 们 的 谈话 更 切合 工 
fe, 并 更 加 简短 。 结对 编程 方法 的 使 用 使 得 两 人 可 以 分 工 , 一 人 去 回答 问题 ， 另 一 个 则 继续 工作 。 
虽然 有 这 些 优点 ， 不 过 随 之 而 来 的 还 有 一 些 问题 。 单 干 团队 大 量 地 使 用 了 Email 和 聊天 系统 来 进 
行 沟通 。 和 谈话 的 沟通 方式 不 同 ， 这 种 书面 沟通 会 留 下 记录 ， 以 供 以 后 查阅 。 大 量 使 用 谈话 作为 
沟通 方式 会 不 会 对 敏捷 团队 的 长 远 发 展 造成 影响 还 有 待 研究 。 
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16.3 ”如 何 看 待 沟通 


我 们 可 以 用 一 个 比喻 来 帮助 你 理解 本 文 介绍 的 各 种 沟通 问题 。 我们 可 以 把 程序 员 想 象 成 操作 
系统 中 的 线程 调度 程序 。 程 序 员 的 工作 “算法 ”如 示例 16-1 所 示 。 

eA SHY x TET, 我 们 首先 总 贤 一 下 操作 系统 是 如 何 调 度 线程 的 。 调度 召 中 保存 着 一 个 
队列 的 线程 ， 它 们 痢 准 备 好 可 以 运行 了 。 调 度 如 将 选择 一 个 线程 并 运行 ， 直到 这 个 线程 被 输入 所 
阻塞 。 被 阻塞 的 线程 将 被 放 到 等 候 队 列 中 , 直到 输入 完成 。 输入 古 以 中 断 的 形式 异步 抵达 的 (pil 
如 ， 网 络 封 包 抵达 系统 或 者 硬盘 数据 块 复制 到 内 存 )。 当 输入 抵达 时 ， 调 度 妖 会 找到 这 个 输入 所 
对 应 的 阻塞 中 的 线程 ,并 把 这 个 线程 移 回 活动 队列 。 在 处 理 完 中 断 之 后 ， 调 度 各 将 继续 运行 活动 
队列 中 的 下 一 个 线程 。 


示例 16-1 开发 人 员 的 每 天 就 像 在 做 线程 调度 


void beProductiveProgrammer () 


{ 





while (!quittingTime) 
try i 
var task = readyTasks.pickOne(); 
while (!task.isDone && !task.isBlocked) 
task.makeProgress(); 
if (task.isBlocked) 
blockedTasks.add(task) ; 
readyTasks.remove (task); 
} 
catch (Interruption interruption) { 
var info = interruption.informationContent; 
for (var task in blockedTasks) 
if (task. blockedOn(info)) { 
blockedTasks.remove (task); 
readyTasks.add(task) ; 


XF RFE BEI 7 Ay FA EAS EE SP ZA IE A A LEAT Ay a A, 程序 员 进 行 
编程 任务 (线程 )， 直 到 他 由 于 缺乏 信息 而 不 能 继续 进行 下 去 (线程 被 输入 阻塞 )。 然 后 她 把 这 个 
任务 放下 并 开始 进行 另 一 个 任务 ,以免 没事 做 。 当 中 断 发 生 的 时 候 (办 公 室 的 交谈 、 打 电话 、 收 
发 电子 邮件 等 ), 常常 也 会 带 来 相关 的 信息 (比如 之 前 缺乏 的 信息 )。 在 程序 员 了 解 这 个 信息 之 后 ， 
就 可 以 恢复 此 前 正 等 待 这 个 信息 的 任务 。 

我 们 可 以 天 真 地 认为 只 有 内 部 的 那个 循环 才 古 程序 员 真正 的 “实效 时 间 ”。 但 是 ， 正 如 本 半 
介绍 的 研究 表明 的 那样 , 这 种 观点 并 不 符合 实际 情况 。 程序 员 只 有 在 没有 问题 或 者 无 需 交 流 就 能 
找到 答案 的 时 候 才 会 处 在 内 部 的 那个 循环 。 但 是 这 些 研 究 表 明 , 程序 员 在 日 贡 工 作 中 很 多 时 候 都 








O 如 采 线 程 运 行 时 间 太 长 而 又 疫 有 受到 任何 阻塞 ， 调 度 侨 就 会 终止 其 运行 ， 但 是 这 一 点 和 我 们 的 比喻 无 关 。 我 们 可 
以 用 这 个 来 比喻 程序 员 的 无 聊 生 活 ! 
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会 过 到 问题 ， 而 这 RESTA eB iti 人 E 解 决 。 这 些 同 题 的 一 个 主要 的 原因 是 对 设计 理念 相关 信 
息 的 需求 ， 因 为 这 种 信息 第 常 只 存在 于 团队 的 集体 记忆 中 。 

ep a S A 从 经 济 的 角度 来 
说 ， 这 不 征 个 好 主意 。 开 发 团队 每 天 会 做 出 上 千 个 决定 ， 这 些 决 定 从 最 小 的 本 地 变量 的 名 字 ,， 到 
影 啊 整 个 产品 及 团队 的 需求 或 者 架构 。 随 着 项 目的 发 展 ， 有 的 决定 将 会 不 断 地 被 重新 提 及 ， 而 有 
的 决定 则 是 决定 了 之 后 就 一 直 保 持原 状 。 也 就 是 说 对 文档 进行 投资 是 有 相当 风险 的 〈 或 者 更 直 白 
的 说 ， 就 是 在 赌博 )。 只 有 当 广 足下 面 这 些 条 件 的 时 候 ， 才 值得 把 决定 用 文档 记录 下 来 : 

a 信息 ， 

这 个 决定 的 影响 时 间 将 会 非常 地 长 ， 后 面 进项 目的 程序 员 也 会 受到 影 啊 ， 

和 

D 编写 文档 的 成 本 低 于 直接 通过 沟通 回答 问题 的 成 本 。 

这 些 条 件 部 是 猪 济 性 的 ， 我们 也 并 不 完全 确定 。 尽 省 有 着 这 些 不 确定 性 , 很 多 团队 也 还 是 尽 
力 明 智 地 选择 对 文档 的 投入 。 他 们 只 用 文档 记录 级 别 最 高 、 受 众 最 三、 最 为 稳定 的 决策 ， 而 剩 下 
的 就 由 沟通 来 解决 了 。 
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第 17 章 
结对 编程 


Laurie Williams 


结对 编程 是 两 个 程序 员 并 肩 工 作 在 一 台电 脑 前 的 编程 方式 。 他 们 在 同样 的 设计 、 算 法 、 代 码 
或 者 测试 上 持续 合作 。 结 对 编程 已 经 零星 地 实践 了 几 十 年 ”“。 然 而 ， 20 世纪末 敏捷 方法 论 和 极限 
编程 (XP) “的 出 现 把 结对 编程 实践 推 到 了 众人 面前 。 

在 结对 编程 中 ， 一 方 叫 做 “驾驶 员 ， 负 责 在 电脑 前 打字 或 者 把 写 设 计 。 另 一 方 叫做 “ 导 谣 
员 ， 人 负责 许多 工作 。 其 中 一 项 是 观 侍 过 驶 员 的 工作 成 东 ,， 寻 找 成 术 和 战略 上 的 缺陷 。 战 术 缺 陷 可 
能 古语 法 错误 、 打 字 错 误 或 调用 错 了 方法 。 战 略 缺 陷 是 指 吉 驶 员 的 编码 实现 或 者 设计 和 最终 将 不 能 
达到 目标 。 寻 航 员 在 两 人 中 更 多 思考 长 期 的 战略 目标 。 由 于 导航 员 并 不 这 入 涉及 设计 、 算 法 、 代 
码 或 测试 ， 所 以 他 具有 更 客观 的 视角 ， 能 够 更 好 地 从 战略 上 思考 工作 方向 。 结 对 中 的 两 人 是 聊天 
伙伴 , 会 不 断 进行 头脑 风暴 。 有 效 的 结对 伙伴 会 经 常 讨论 解决 问题 的 其 他 可 能 方法 和 方案 ”“” 。 
如 末 导 航 员 过 于 安静 ， 那 可 能 古 结对 运转 不 民 的 信号 。 芍 驶 员 和 导航 员 应 该 定时 更 换 角 色 。 在 一 个 
软件 开发 团队 中 ， 团 队 成 员 应 该 与 其 他 不 同 的 队员 结对 ， 以 此 来 更 好 地 利用 各 目的 经 验 。 

结对 编程 这 一 名 字 可 能 会 ?| 起 人 们 的 误解 , 认为 软件 工程 师 和 其 他 软件 开发 人 员 只 在 编码 
阶段 结对 。 然 而 ， 结 对 可 以 发 生 在 开发 流程 的 所 有 阶段 : 结对 设计 、 结 对 调试 、 结 对 测试 ， 等 等 。 
程序 员 可 以 在 开发 中 的 任何 时 刻 与 人 结对 ， 特 别 征 在 他 们 处 理 复 杂 和 不 熟悉 的 问题 时 。 此 外 ， 产 
品 经 理 可 以 与 用 户 界面 设计 师 结 对 ， 合 作 开发 用 户 体验 。 测 试 人 员 和 开发 人 员 可 以 结对 ， 合 作 开 
发 目 动 化 测试 。 徐 而 言 之 , 结对 编程 中 并 肩 合作 的 方式 可 以 在 所 有 开发 阶段 被 许多 团队 成 员 使 用 。 

这 半 会 以 结对 编程 的 使 用 人 简 史 开始 。 然 后 , 我 将 分 别提 供 在 产业 界 和 学 术 界 使 用 结对 编程 的 
信息 。 在 这 之 后 , 我 将 讨论 分 布 式 结对 编程 ,也 就 是 程序 员 不 在 同一 个 地 点 时 使 用 结对 编程 的 方 
法 。 最 后 ， 我 将 提出 大 面积 推广 结对 编程 所 面临 的 挑战 。 


17.1 结对 编程 的 历史 


结对 编程 在 人 们 给 它 这 个 名 字 之 前 , 已 经 被 提倡 并 使 用 了 几 十 年 。《 人 月 神话 的 作者 Fred 
Brooks 说道 :“ 我 在 读 研 究 生 的 时 候 和 我 的 同学 Bil Wright 首次 尝试 了 结对 编程 (1953 年 ~ 1956 
年 )。 我 们 写 了 1500 行 没有 缺陷 的 代码 ， 第 一 次 尝试 运 行 就 通过 了 。”“” 

在 20 世 纪 80 年 代 早 期 ， 曾 发 表 过 150 多 篇 技术 文章 和 16 部 车 作 的 Larry Constantine 汇 报 了 在 
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Whitesmith 有 限 公司 观 察 到 的 “动态 二 人 组 ”， 他 们 能 更 快 地 产 出 错误 更 少 的 代码 “。 他 评论 道 ， 
两 个 聪明 脑袋 合 在 一 起 ， 并 相互 信任 地 稳定 沟通 ， 能 使 代码 受益 匪 浅 。 他 也 总 结 说 ， 两 个 程序 员 
合伙 并 不 多 余 ， 相 反 这 在 更 高 效率 和 更 好 质量 的 直达 途径 。 

基于 贝尔 实验 室 Pasteur 项 目的 研究 结 末 (一 个 对 50 家 高 效 的 软件 开发 组 织 的 大 型 社会 学 和 人 
类 学 研究 ) James Coplien 在 1995 年 发 表 了 “结对 开发 ”的 组 织 模式  “。Coplien 把 这 种 模式 的 
力量 摘 述 为 :“ 有 时 人 们 只 有 在 获得 帮助 时 才 感 党 他 们 能 解决 问题 。 而 有 一 些 问题 不 是 任何 一 个 
人 单独 可 以 解决 的 。 这 个 组 织 模 却 提出 的 解决 方案 征 “ 让 相 容 的 两 个 设计 者 结对 工作 ， 他 们 一 
起 的 产 出 多 于 各 目 产 出 的 总 和 ”。 应 用 这 种 模式 的 结 琳 是 “更 有 效 地 实现 流程 ， 而 且 两 个 人 结对 
工作 不 那么 容 匈 出现 独 目 工作 时 的 那些 家 区 。 

1998 年 ， 坦 普尔 大 学 的 教授 John Nosek 第 一 个 对 结对 编程 的 有 效 性 进行 了 经 验 性 研究 ” 。 
Nosek 汇 报 了 15 个 有 经 验 的 全 职 程 序 员 的 工作 ， 给 他 们 45 分 钟 时 间 来 解决 对 他 们 的 组 织 有 挑战 性 
的 问题 。 在 这 些 程序 员 目 己 的 环境 和 目 己 的 设备 中 ，5 个 人 独 目 工作 ， 画 外 10 个 人 结 成 5 对 工作 。 
工作 条 件 和 工作 材料 对 试验 小 组 〈 结 对 ) 和 对 照 小 组 (个 人 ) 都 相同 。 双 侧 {t 分 布 检验 显示 ， 此 
研究 近 供 了 显 赦 的 统计 结 东 。 绪 对 的 小 组 在 任务 上 总 共 多 化 了 60% 的 时 间 。 然 而 ， 由 于 他 们 征 双 
人 作战 ， 他 们 完成 任务 的 速度 比 对 照 小 组 快 了 20%。Nosek 也 汇报 了 结对 小 组 产 出 了 更 好 的 算法 
和 代码 。 

正如 我 之 前 提 到 的 ， 在 20 世 纪 末 和 21 世 纪 惫 ，XP 软 件 开发 方法 论 的 出 现 把 结对 编程 推 到 了 
前 线 。XP 出 现 后 ,许多 人 对 结对 编程 有 所 怀疑 ， 因 为 他 们 相信 如 来 两 个 程序 员 一 起 工作 ， 花 在 
编码 任务 上 的 工作 量 会 翻 倍 。 

在 1999 年 ， 针 对 这 种 怀疑 ， 犹 他 大 学 进行 了 大 量 的 实证 研究 “ ” “" ， 期 待 找 出 结对 编程 的 
成 本 及 收益 。41 个 软件 工程 本 科 三 四 年 级 的 学 生 参 与 了 一 学 期 15 周 的 精心 设计 的 实验 。 上 课 的 第 
一 天 ， 学 生 被 询问 征 合 更 愿意 结对 或 单独 工作 ， 想 与 谁 一 起 工作 , 不 想 与 谁 一 起 工作 。 学 生 们 也 
根据 他 们 学 习 成 绩 的 平均 等 级 分 (GPA) 被 归 类 为 “优等 生 ”(25% 最 好 的 学 生 )、“ 普 通 生 ”和 
差 等 生 ”(〈25% 最 差 的 学 生 ) 。28 位 学 生 被 分 在 结对 小 组 ，13 位 被 分 在 单独 小 组 。 我 们 用 GPA 来 
保证 两 组 的 学 术 水 平 相同 。14 对 学 生 中 ，13 对 是 互相 选择 的 ， 也 就 古 每 个 学 生 都 在 之 前 要 求 和 他 
的 搭档 合作 。 节 后 一 组 是 分 配 的 ， 因 为 他 们 疫 有 表示 对 搭档 的 仿 好 。 

所 有 的 学 生 都 收 到 了 一 份 有 效 结对 编程 的 说 明 , 并 得 到 了 一 篇 天 于 如 何 才能 成 功 地 进行 合作 
的 论文 “， 以 帮助 他 们 更 好 地 准备 。 研 究 使 用 明确 的 度量 标准 来 保证 结对 小 组 每 周 都 一 直 工 作 在 
一 起 。 每 周 有 一 课时 安排 学 生 人 了 研 究 他 们 目 己 的 项 目 。 邑 外 ,我 们 要 求学 生 每 周 必 须 与 搭档 在 办 公 
时 间 合 作 进 行 项 目 两 小 时 。 在 这 些 有 规律 的 见面 时 间 中 ,这 些 配对 逐渐 成 形 而 且 相 互 的 关系 也 更 
紧密 ， 因 而 也 就 更 有 可 能 安排 额外 的 时 间 一 起 来 完成 他 们 的 工作 。 

结对 小 组 通过 了 明显 更 多 的 后 开发 (post-development) 自动 化 测试 用 例 , 这 些 用 例 是 由 助教 
来 公平 运行 的 ( 见 表 17-1)。 结对 中 的 学 生平 均 多 通过 了 15% 的 教师 布置 的 测试 用 例 。 质量 差别 的 
统计 显著 性 也 达到 p<0.01。 
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表 17-1 ”犹他 大 学 结对 编程 比较 


单独 工作 学 生 的 测试 通过 率 结对 工作 学 生 的 测试 通过 率 
程序 1 73.4% 86.4% 
程序 2 78.1% 88.6% 
程序 3 70.4% 87.1% 
程序 4 78.1% 94.4% 


研究 结 末 也 显示 ， 结 对 小 组 平均 比 独立 小 组 多 伦 了 15% 的 编程 时 间 来 完成 项 目 。 比 如 ， 如 采 
一 个 人 花 了 10 小 时 在 作业 上 ， 那 结对 中 的 每 个 个 体 大 约 就 会 化 平均 5 小 时 45 分 钟 。 但 古 两 组 所 花 
的 时 间 中 值 基本 相同 ， 平 均 差 没有 统计 显著 性 。 即 使 多 花 了 15% 的 时 间 ， 从 提升 的 质量 来 看 ， 结 
对 编程 仍然 是 经 济 可 行 的 软件 开发 实践 ”。 犹 他 大 学 的 研究 在 有 产业 经 验 的 研究 生 中 也 运行 了 一 
个 过 16 周 多 的 学 期 。 然 而 ， 这 些 实验 结 来 只 对 学 术 环 境 适 用 。 

犹他 大 学 的 研究 结 末 显示 了 结对 编程 在 不 加 倍 人 力 资 源 的 情况 下 仍然 能 够 效益 ， 在 XP 实 践 
的 运用 和 犹他 大 学 研究 成 末 基 础 上 , 结对 编程 开始 在 产业 和 教育 中 更 流行 起 来 。 下 两 市 将 概述 结 
对 编程 在 这 两 种 环境 下 的 使 用 情况 。 


17.2 ”产业 环境 中 的 结对 编程 
这 一 节 概 述 一 些 在 企业 中 得 到 证 明 的 结对 编程 实践 以 及 它们 的 结果 。 
17.2.1 结对 编程 的 行业 实践 


软件 行业 中 的 团队 汇报 了 对 于 结对 编程 持续 稳定 的 使 用 经 验 。 当 从 单独 开发 转 为 结对 开发 
时 ， 开 发 者 通常 需要 几 天 (AAS ~ 12 小 时 ) 来 熟悉 和 适应 这 种 动态 实践 ”1。 在 上 一 章 所 引用 的 
犹他 大 学 的 研究 中 ， 学 生 们 在 第 一 个 程序 后 就 适应 了 结对 编程 ， 大 约 花 了 8 一 10 小 时 。 通 第 ， 程 
序 员 不 会 整 天 结对 ， 可 持续 结对 工作 的 时 间 长 度 是 1.5 ~4 小 时 1。 延长 结对 编程 的 时 间 对 开发 者 
来 说 会 很 困难 ， 结 对 工作 的 快 节 奏 和 对 手头 工作 的 持续 聚焦 会 使 你 精疲力竭 "“ A, 

在 产业 团队 中 ,轮换 结对 是 一 种 保持 动态 结对 的 稼 见 实践 ， 而 不 是 分 配 完 搭档 后 一 次 结对 几 
天 或 几 星 期 许多 团队 每 天 轮换 配对 好 几 次 " ,或 至 少 每 天 一 次 ”1。 经常 地 轮换 结对 对 团队 中 的 
知识 传递 很 有 好 处 ”1。 另 外， 轮换 结对 可 以 帮助 教导 和 培训 新 的 团队 成 员 ，Menlo Innovations, 
微软 、 摩 托 罗 拉 、Silver Platter 软 件 以 及 一 家 不 愿 透露 姓名 的 大 型 意大利 制造 商 已 经 用 经 验证 明 
了 这 一 点 (详情 参见 参考 文献 [6]|、[25]、[36]、[73])。 决 定 与 谁 结 对 通常 比较 随意 ， 也 不 会 有 什 
么 困难 中 M1。 经 常 在 一 个 简短 的 用 来 讨论 每 日 情况 和 当前 挑战 的 例会 中 就 能 决定 ， 比 如 “站 立 
会 议 ”或 Scrum 中 的 每 日 例会 (Scrum 是 一 种 敏捷 软件 开发 方法 论 ) ” 。 

轮换 驾驶 员 和 导航 员 的 角色 对 保持 两 个 软件 工程 师 同时 投身 工作 很 重要 “1 中 。 然而， 在 一 
个 为 期 4 个 月 的 研究 中 ，Chong 和 Hurlbutt 观 察 了 两 个 实践 结对 开发 的 专业 软件 开发 团队 ， 他 们 的 
结对 伙伴 中 并 没有 驾驶 员 和 导航 员 的 角色 一 。 当 程序 员 能 力 相 同时 ， 他 们 会 共同 讨论 并 想 办 法 。 
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在 这 种 情况 下 ， 驾 驶 员 主 要 扮演 打字 者 的 角色 。 当 程序 员 能 力 水 平 不 同时 ,能力 较 强 的 那个 软件 
工程 师 会 主导 两 人 的 互动 。 

Chong 和 Hurlbutt 也 注意 到 了 键盘 的 持 有 权 对 决策 权 有 微妙 却 重 要 的 影响 : 驾驶 员 通 肖 是 最 终 
决定 者 。 他 们 注意 到 键盘 通 闸 被 来 回 传 递 ， 工 程 师 们 在 共同 做 轰 驶 员 和 导航 员 时 最 有 效 。 当 他 们 
得 到 键盘 或 感到 即将 控制 键盘 时 ,似乎 更 投入 工作 ,因此 ,他 们 支持 使 用 双 份 键盘 和 鼠标 Hofer 
和 Freudenberg 等 人 四] 实施 的 分 析 支 持 Chong 和 Hurlbutt 的 发 现 。 

IBM 和 Guidant 的 开发 团队 可 以 选择 使 用 结对 编程 或 代码 检查 。 得 到 这 个 选择 权 后 , 一 些 IBM 
的 团队 增加 了 5% ~ 50% 的 结对 编程 使 用 时 间 :”， 而 Guidant 几 乎 所 有 时 间 都 在 使 用 结对 编程 ”.。 

通常 , 软件 工程 师 觉 得 结对 编程 应 当 只 应 用 在 编写 规范 说 明 、 做 设计 和 较为 复杂 的 编程 任务 
上 (详情 参见 参考 文献 [18]、[32]、[39]、[61]、[62]、[63])。 一 个 大 型 的 295 个 咨询 师 参与 的 实验 
证 明 ， 在 复杂 任务 上 结对 提高 了 质量 ， 而 对 于 简单 任务 却 无 任何 提高 …。 

团队 在 使 用 有 组 织 有 结构 的 结对 编程 方法 时 ， 成 功率 更 高 。 比 如 ， 公 开 显 示 结 对 的 小 时 数 ， 
或 者 在 每 日 例会 中 分 配 结对 对 象 , 而 不 是 自愿 或 非 正式 的 使 用 结对 编程 。 在 一 个 组 织 中 ,一 项 
调查 显示 了 对 结对 编程 的 正面 反馈 和 更 多 的 使 用 意愿 。 然 而 ,这些 工 程 师 认 为 无 法 使 用 更 多 结对 
编程 的 原因 来 产 于 组 织 ， 比 如 找 不 到 共同 的 时 间 、 团 队 负 责 人 不 支持 、 在 项 目 计划 时 没有 考虑 结 
对 编程 等 。 

在 大 五 人 格 因素 中 有 不 同 的 人 格 类 型 ”已 被 证 明 会 对 专业 结对 编程 者 的 沟通 强度 有 积极 的 
影响 “。( 更 多 大 五 人 格 因素 的 信息 ， 参 见 第 6 章 。) 然而 微软 的 软件 工程 师 认 为 个 性 间 的 冲撞 会 
破坏 结对 的 生产 力 ” ， 结 对 双方 在 有 互补 技能 时 工作 效果 最 好 。 

最 后 ， 结 对 编程 者 觉得 有 更 大 的 果子 、 更 宽 的 屏幕 、 无 线 忌 标 和 无 线 键盘 以 及 墙 上 的 白板 ， 
这 些 都 对 工作 有 益 。 结 对 的 噪 声 会 影响 其 他 单独 工作 的 人 。 专门 在 旁边 为 结对 编程 设置 一 间 屋 子 
或 者 一 块 区 域 可 以 帮助 减轻 这 个 影响 "1。 


17.2.2 业内 使 用 结对 编程 的 效果 


那些 持续 使 用 结对 编程 的 团队 让 我 们 对 于 结对 编程 在 业内 的 实际 使 用 效果 有 了 更 深入 的 了 
解 。 许 多 团队 汇报 了 使 用 结对 编程 后 的 产品 质量 提升 (详情 参见 参考 文献 [5]、[18]、[34]、[39]、 
[61]) 。 有 一 家 大 型 的 分 兰 电信 公司 ,他们 的 软件 工程 师 几 乎 只 工作 在 结对 环境 中 , 在 一 年 半 的 生 
产 过 程 中 只 有 5 个 线 上 故障 ” ， 可 惜 并 没有 基线 比较 数据 存在 。 另 一 个 芬兰 的 对 照 案例 分 析 “ 表 
明 , 在 某 一 个 项 目 中 , 结对 和 单独 开发 有 着 相同 的 缺陷 密度 ， 而 在 男 一 个 项 目 中 结对 开发 的 缺陷 
密度 是 单独 开发 人 员 的 六 分 之 一 。 

由 于 结对 编程 所 产生 的 知识 共享 ”和 开发 环境 改善 等 积极 效应 *“”， 团 队 可 能 因此 被 
激发 而 建立 结对 编程 制度 。 如 东 只 有 一 个 人 理解 一 处 代码 , 团队 就 会 因为 这 个 人 离开 团队 、 病 假 
或 者 休假 而 遇 到 麻烦 。 当 对 每 处 代码 和 都 有 不 只 一 个 人 比较 熟悉 的 时 候 , 整个 团队 的 风险 就 降低 了 。 

团队 发 现 结对 写 出 的 代码 更 容易 理解 ”“”。 驾 驶 员 写 出 的 代码 必须 让 导航 员 读 懂 ， 这 样 就 
能 激励 驾驶 员 写 得 更 清晰 明白 。 同 样 ， 如 林 驾 驶 员 不 理解 代码 ， 导 航 员 会 让 驾驶 员 停 下 来 姜 清 ， 
那样 驾驶 员 重 写 代码 时 就 会 写 得 更 简单 易 懂 。 
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当 工 程 师 们 刚 开始 结对 编程 的 时 候 ， 有 了 时 会 有 一 些 生 产 力 的 下 降 ' J。 当 一 个 团队 持续 使 用 
结对 编程 后 , 在 软件 工程 师 工作 在 复杂 任务 上 时 , 结对 编程 会 对 生产 力 产 生 正面 影响 1。 A 
测 其 他 的 研究 中 所 显示 的 生产 力 下 降 号 是 因为 只 研究 了 个 人 的 任务 或 者 较 小 的 项 目 。 另 一 
个 团队 认为 他 们 有 一 小 幅度 的 生产 力 下 降 ” ， 这 与 之 前 研究 所 观察 到 的 一 样 ““ WI 。 对 四 个 芬 
兰 团 队 的 对 照 案 例 分 析 中 并 没有 显示 出 任何 单个 或 结对 程序 员 的 更 高 或 更 低 生 产 力 模式 。 总体 说 
来 ， 这 些 研究 只 用 了 “每 人 月 的 代码 行 数 ” 作 为 生产 力度 量 ， 这 种 度量 通常 被 认为 是 不 精确 的 。 

团队 认为 使 用 结对 编程 提高 了 团队 的 士气 。 他 们 也 认为 使 用 结对 编程 帮助 了 他 们 使 用 其 他 实 
践 的 纪律 性 ， 如 测试 驱动 型 开发 、 代 码 规范 的 使 用 以 及 频繁 集成 5 。 

一 个 涉及 8 个 专业 软件 开发 人 员 的 结构 化 实验 在 泰国 展开 , 以 比较 Fagan 检 查 和 结对 编程 的 
结果 。 结 对 多 花 了 4% 的 时 间 完 成 产品 开发 ， 但 是 在 用 户 验收 测试 时 检测 到 的 缺陷 却 少 了 39%6”。 


17.3 教育 环境 中 的 结对 编程 


在 大 部 分 情况 下 ,， 学 生 们 和 从 业者 们 用 同样 的 方式 结对 编程 。 在 这 一 市 中 ,我 们 讨论 一 些 学 
生 特 有 的 结对 编程 实践 ， 并 从 教育 文献 中 引用 一 些 结对 编程 的 使 用 结 采 。 


17.3.1 教学 中 特有 的 实践 


教职员 工 可 能 会 允许 学 生 选 择 他 们 的 搭档 ， 也 可 能 主动 安排 学 生 配 对 ， 让 看 起 来 能 一 
起 合作 得 较 好 的 学 生 结 对 。 那些 选择 配对 的 人 会 使 用 探索 式 的 方法 来 慢 慢 组 成 最 有 效 的 配对 。 一 
项 研究 表明 男女 搭配 能 产生 更 高 质量 和 更 有 创造 性 的 结果 。 一 项 58 个 本 科 生 参与 的 研究 表明 ， 
结对 双方 如 果 为 他 们 的 思想 开放 程度 和 负责 程度 打出 相似 的 分 数 时 , 工作 效果 最 好 ”1。 另 一 项 54 
个 本 科 生 参与 的 研究 表明 ， 基 于 大 五 人 格 因素 模型 ， 责 任 心 和 作业 得 分 之 间 有 正 相 关 性 ， 接 纳 新 
事物 的 开放 程度 和 测试 成 绩 之 间 也 有 正 相关 性 1。 
研究 人 员 开 展 了 一 项 涉及 1350 个 学 生 的 大 型 实证 研究 , 来 调查 教职员 工 预先 帮 学 生 协 调配 对 
时 可 以 利用 的 因素 '"“。 研究 显示 ， 大 多 数 情 况 下 (93% 的 结对 学 生 如 此 认为 ) 学 生 认为 与 他 们 的 
搭档 协调 一 致 。 研 究 结 果 也 显示 ， 教 职员 工 可 以 使 用 以 下 一 种 或 几 种 标准 来 使 学 生 配 对 更 相 容 。 
口 让 有 相似 技能 水 平 的 学 生 结对 , 可 以 用 计算 机 科学 的 GPA 和 /或 总 GPA 来 度量 。(Toll 等 人 ” 
Grant Braught 等 人 ， 以 及 Sennett 和 Sherriff 也 支持 配对 的 学 生 有 相似 的 技能 水 平 中 1,) 
口 让 Myers-Briggs 个 性 类 型 "中 的 感觉 型 人 和 直觉 型 人 配对 。 
O 让 有 相似 工作 规范 的 学 生 配 对 。 可 以 让 学 生 在 1~9 中 选 一 个 数字 ，1 表 示 做 到 足以 混 过 去 
就 行 了 ，9 表 示 努 力 做 到 最 好 。 选 择 相近 数字 的 学 生 配对 更 好 。 
轮换 结对 在 教学 环境 中 比 产业 环境 中 做 得 少 。 通 常 搭 档 们 在 整个 作业 阶段 都 在 一 起 工作 (1~3 
fal) 上 。 一 些 教育 者 更 喜欢 让 搭档 们 持续 一 整个 学 期 一 。 


























®© Myers-Briggs 个 性 类 型 指数 (MBTI) 是 一 种 者 名 的 人 格 测 试 。 它 把 人 格 分 为 四 对 相反 的 因素 ， 这 样 所 有 的 人 格 就 
被 分 为 16 种 类 型 。 感 觉 型 和 直觉 型 是 MBTI 中 的 一 对 相反 因素 。 一 一 译 者 注 
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17.3.2 教学 中 使 用 结对 编程 的 效果 


有 全 究 证 明 ， 结 对 编程 创造 了 一 个 有 益 于 主动 学 习 和 社会 交往 的 环境 ,使 学 生 少 受挫 ， 更 目 
信  ， 而 且 对 IT 更 有 兴趣 (详情 参见 参考 文献 []、[37]、[38]、[45]、[57]) 。 这 与 传统 单独 编程 
教学 的 缺点 形成 了 强 名 对 比 ， 传 统 教 学 使 学 生 感觉 抓 立 、 受 挫 、 对 目 己 的 能 力 不 确 定 。 结 对 编程 
DD SPE LAS Sel ee, A ee TEAR, AS RAIA GE. SRE 
把 协作 的 环境 看 得 很 重 ”。 另 外 , 结对 编程 中 固有 的 协作 使 学 生 不 得 不 接触 产业 环境 中 所 需 的 协 
作 、 团 队 合 作 、 交 流 技 巧 ， 并 使 他 们 从 中 得 到 锻炼 。 这 种 益处 似乎 能 帮助 计算 机 科学 留 住 人 才 ， 
特别 是 女性 (详情 参见 参考 文献 [10]、[41]、[42]、[71])。 总 的 说 来 ,结对 编程 提供 了 一 种 真实 反 
映 出 “实验 室 模 型 ”的 方法 ， 这 在 自然 科学 领域 (如 物理 和 化 学 ) 是 一 种 常用 的 实践 ”。 

结对 工作 的 学 生 通 稍 产 出 更 高 质量 的 项 目 , 并 有 更 高 的 课程 通过 率 (详情 参见 参考 文献 [42]、 
[71]. [8], [76], [43]), ， 即 使 当 学 生 在 分 布 式 环 境 下 结对 编程 结果 也 如 此 〈 详 见 下 一 节 ) “。 在 
入 门 级 课程 中 结对 的 团队 在 将 来 需要 单独 编程 的 课程 中 更 成 功 。 一 项 在 佩斯 大 学 本 科 生 中 
进行 的 研究 发 现 , 根 据 学 生 开发 项 目 和 考试 分 数 的 成 绩 来 看 , 课外 协作 与 学 生 表现 有 正 相 关 性 … 。 
在 一 项 迪 金 森 学 院 〈 一 所 文科 院 校 ) 涉及 本 科 生 的 研究 中 ， 即 使 是 SAI 分 数 较 低 的 学 生 在 使 用 结 
对 编程 后 也 能 达到 更 高 的 实验 分 数 ”。 

结对 编程 也 能 使 教职员 工 受 益 。 由 于 只 有 一 半 的 作业 提交 ，, 评分 的 工作 就 少 了 许多 。 绪 对 的 
学 生 通 前 能 解决 低级 的 技术 或 程序 问题 ,而 这 些 问 题 往 往 会 占据 实验 室 助教 和 教师 大 量 时 间 , 也 
是 其 邮件 中 的 主要 主题  。 最 后 ,“ 问 题 学 生 ” 也 会 相应 减少 ， 因 为 结对 编程 中 来 自 同伴 的 压 
力 或 励 所 有 学 生 积 极 参 与 课程 。 学 生 不 希望 影响 同伴 的 成 绩 ， 因 此 会 对 布置 的 作业 更 努力 , 通 第 
比 单独 工 作 的 情况 下 开始 得 更 早 (虽然 并 不 是 所 有 学 生 都 开始 得 更 早 “ )。 

固然 ， 实 施 结对 编程 也 会 有 一 些 成 本 。 对 学 生来 说 ， 主 要 有 两 项 成 本 没有 明显 的 解决 方法 。 
一 小 部 分 学 生 (大 约 5%) 总 需要 独自 工作 。 这 些 常常 是 尖子 学 生 ， 他 们 不 希望 被 其 他 学 生 拖 
后 腿 ， 也 不 筑 得 指导 别人 对 他 们 有 益 。 另 一 个 问题 是 在 读 程 和 实 骆 室 之 外 结对 编程 时 ， 需 要 协调 
时 间 安 排 。 


17.4 分布 式 结对 编程 


分 布 式 软件 开发 在 产业 界 已 经 是 常用 的 实践 了 。 在 教学 中 , 学 生 也 更 喜欢 在 他 们 的 寝室 或 家 
ETH, 而 不 是 去 实验 室 和 他 们 的 搭档 工作 。 另 外 ， 登 记 远 程 教学 课程 的 学 生 可 能 永远 不 能 面 对 
面 交 流 。 分 布 式 的 工作 者 可 以 使 用 一 系列 工具 通过 因特网 实践 结对 编程 。 在 最 简单 的 情况 下 , 程 
序 员 可 以 使 用 VNC 或 Windows 会 议 空 间 ”( 之 前 的 网 络 会 议 ) 来 共享 桌面 。 这 些 工具 能 把 一 方 任 
何 应 用 程序 所 显示 的 输出 传送 给 其 他 人 ， 这 当然 需要 个 人 之 则 足够 的 带宽 、 信 任 和 安全 性 。 其 他 
TĦ, 4gSangam®™, xpairtise®, COPPER 9 或 Facetop 只 传播 对 结对 编程 重要 的 信息 ， 比 如 驾 












































@ http://www.realvnc.com/, 
© http://www.microsoft.com/windows/products/windowsvista/features/details/meetingspace.mspx , 


© http://xpairtise.sourceforge.net/ 。 
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驶 员 最 新 的 改动 。 

分 布 式 认 知 专家 Nick Flor 强 调 了 分 布 式 结对 编程 系统 对 支持 跨 工作 空间 的 视觉 、 手 工 、 音 频 
通道 的 重要 性 一 。 这 些 通道 使 结对 双方 相互 合作 , 为 进行 中 的 知识 共享 和 互助 行为 提供 了 微妙 却 
重要 的 催化 剂 。 比 如 ， 微 妙 的 手势 ， 如 摇头 或 喃 喃 上 自 语 对 结对 间 的 信息 互 换 是 一 种 催化 剂 。 通 过 
Facetop" 展示 在 屏幕 上 的 清晰 的 搭档 形象 可 以 帮助 这 些 信息 通道 的 传播 。 此 外 ，Chong 和 
Hurlbut 不 鼓励 使 用 定义 了 驾驶 员 和 导航 员 角 色 的 工具 ,如 Sangam tr 因为 它们 约束 了 更 有 
效 的 结对 编程 行为 : 在 整个 时 间 段 中 同时 扮演 驾驶 员 和 导航 员 的 角色 。 

在 北 卡罗来纳 州立 大 学 和 北 卡 罗 来 纳 大 学 教堂 山 分 校 , 已 经 进行 了 一 些 分 布 式 结对 编程 的 研 
究 ““。 这 些 研 究 表明 ， 通 过 因特网 结对 比分 布 式 非 结对 团队 更 有 浴 力 ， 非 结对 团队 的 程序 员 独 
了 立 工 作 ， 在 更 晚 的 时 候 集 成 代码 。 在 这 些 研 究 中 ， 学 生 使 用 梨 面 共享 软件 NetMeeting， 以 及 雅虎 
通 、 耳 机 和 老 克 风 来 进行 交流 。 也 有 了 研究 者 对 印第安 纳 大 学 伯 明 顿 分 校 的 信息 学 本 科 生 进行 了 一 
项 关于 计算 机 科学 入 门 课 程 的 调查 ， 学 生 使 用 Adobe Connect Now 网 络 会 议 软件 进行 分 布 式 结对 
编程 “。 结 果 表 明 ， 学 生 普遍 看 好 结对 编程 ， 但 是 对 分 布 式 结对 编程 却 远 没 有 那么 热 囊 。 


17.5 面 对 的 挑战 


之 前 讨论 的 结 采 显示 了 团队 使 用 结对 编程 实践 后 能 从 各 种 角度 获 益 。 然 而 一 些 挑战 阻止 了 结 
对 编程 的 传播 。 在 这 一 三 中 ， 我 们 列 出 四 个 挑战 ， 并 对 如 何 殉 服 挑 战 提 出 建议 。 

e 0000D 

软件 工程 师 习 惯 于 独立 工作 ,特别 是 那些 没有 受过 结对 编程 实践 相关 教育 的 。 因 此 , 许 
多 人 担心 他 们 与 其 他 人 一 起 工作 的 时 候 不 能 专心 , 也 许 他 们 会 和 速度 慢 的 程序 员 一 起 “浪费 
时 间 ， 也 许 他 们 和 其 他 伙伴 比 起 来 能 力 不 足 ， 也 许 还 有 其 他 的 担心 。 然 而 ， 在 那些 试 过 此 
实践 的 程序 员 中 , 他 们 中 的 90% 更 喜欢 结对 编程 而 不 是 独立 编程 。 因为 大 部 分 工程 师 最 
终 会 喜欢 这 个 实践 ,所 以 克服 这 个 挑战 的 策略 是 以 非 威胁 性 的 小 范围 试点 开始 。 这些 工 程 师 
很 有 可 能 会 发 现 结对 编程 的 益处 , 所 以 就 更 可 能 会 在 过 到 有 挑 成 的 编程 任务 时 和 同事 们 目 发 
开始 结对 编程 。 
eHUUU 

RAAU SAAR ASG AS , 但 是 软件 公司 仍 可 能 会 担心 结对 编程 会 使 软件 开发 的 成 本 
翻 倍 ， 因 为 两 个 程序 员工 作 在 一 个 任务 上 “。 一 个 微软 老板 的 话 曾 经 被 引用 ,“ 如 果 我 能 ; 
择 的 话 ， 我 会 雇用 一 个 星 级 程序 员 而 不 是 两 个 需要 结对 的 程序 员 .” “管理 层 应 该 受到 结对 
编程 的 研究 和 使 用 经 验 的 局 发 。 可 以 从 小 苑 围 开 始 实践 ， 那 只 会 有 很 少 的 经 济 风险 。 然 后 ， 
管理 层 就 可 以 得 到 一 手 的 理解 : 这 个 实践 不 会 引发 产品 生命 周期 成 本 的 提高 , 特别 在 芳 虑 到 
提升 质量 所 市 来 的 利 爸 的 情况 下 。 
a ll 

当 团 队 中 的 工程 师 实践 结对 编程 时 , 团队 必须 决定 每 天 谁 和 谁 工作 , He oT AE Td, 
此 外 ,团队 也 需要 选择 一 天 中 的 哪儿 个 小 时 古 用 来 结对 的 ， 在 这 些 时 间 中 ,不 能 有 会 议 与 之 
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冲突 。 决 定 结 对 组 成 的 理想 场合 是 每 日 10 到 15 分 钟 的 Scrum 例 会 ”。 在 Scrum 会 议 中 ,工程 
师 们 谈论 他 们 过 到 的 障碍 和 他 们 每 天 将 涉及 的 任务 。 在 这 个 会 议 上 ,可 以 基于 当日 的 工作 任 
务 和 当前 的 挑战 动态 配对 。 
< ULUN 

一 些 团 队 可 能 感觉 他 们 不 能 结对 编程 ,因为 他 们 的 团队 成 员 不 在 同一 地 点 工作 。 正 如 前 
文 所 讨论 的 ， 分布 式 结对 编程 被 证 明 是 一 种 可 行 的 有 益 实 践 。 


17.6 ”经 验 教 训 


使 用 过 结对 编程 的 产业 团队 已 经 意识 到 了 许多 好 处 , 包括 更 高 的 产品 质量 .更 短 的 交付 时 间 、 
相互 学 习 的 促进 、 由 于 更 好 的 知识 管理 而 减少 的 产品 风险 ， 以 及 团队 精神 的 提高 。 尽 管 有 这 些 益 
处 ， 产 业界 整体 的 结对 编程 使 用 率 并 不 高 ,主要 是 因 为 前 一 证 中 所 讨论 的 那些 原因 。 一 小 部 分 公 
司 是 公认 的 结对 编程 “商铺 ”， 去 那里 面试 的 员工 都 了 解 这 个 实践 。 在 许多 其 他 公司 中 ， 结 对 编 
程 通 第 在 团队 成 员 面 临 挑 战 或 复杂 任务 ， 或 者 作为 新 员工 培训 的 一 部 分 时 才 被 主动 实施 。 

学 生 们 和 产业 团队 意识 到 了 同样 的 好 处 , 但 是 研究 结果 显示 了 对 于 学 术 界 的 额外 好 处 : 保留 
信息 技术 领域 的 人 才 , 减 轻 完成 课 党 作业 的 挫败 感 ,让 学 生 更 多 地 认识 他 们 的 同学 以 增加 满足 感 。 
世界 上 许多 导师 也 已 经 意识 到 这 样 教学 的 好 处 : 由 于 评分 工作 的 减少 和 回答 所 有 学 生 技 术 问 题 的 
减少 ,结对 编程 能 减轻 他 们 自己 的 工作 量 。 因 此 ,结对 编程 会 在 教学 中 越 来 越 普 人 遍 。 毕 业 了 的 学 
生 会 把 结对 编程 看 成 是 更 上 自然 的 实践 。 由 此 ,在 未 来 几 年 , 结对 编程 在 产业 界 的 使 用 率 非常 可 能 
会 有 所 提升 。 


17.7 ”致谢 
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第 18 章 


现代 化 代码 审查 


Jason Cohen 


18.1 IR 


为 什么 这 本 书 的 每 一 页 在 出 版 之 前 都 要 由 编辑 审 稿 呢 ? 

因为 即使 你 是 最 聪明 、 最 能 干 、 最 有 经 验 的 作家 ， 你 也 不 能 校对 目 己 的 工作 。 你 与 书 中 的 那 
FORT INTEL J, 那些 词汇 在 你 的 大 脑 里 面 转 了 太 长 时 间 , 你 已 经 无 法 作为 第 一 次 读 到 这 些 词汇 
的 人 来 审阅 目 己 的 文章 了 。 

写 代 码 也 如 此 。 事 实 上 ， 写 文章 不 可 能 缺少 独立 的 审 稿 人 ， 写 代码 也 不 可 能 抓 立地 写 。 代 码 
必须 在 微小 的 细节 上 也 是 正确 的 , 而 且 , 其 中 也 包括 写 给 人 看 的 文字 。( 你 不 是 也 写 代 码 注释 吗 ? ) 

普通 意义 上 ,二 个 人 总 是 强 过 一 个 人 ,尤其 古 当 审 查 者 古 这 个 领域 的 专家 , 或 者 写 代码 的 人 
古 对 这 个 领域 还 不 熟悉 的 初级 程序 员 时 。 

只 征 ， 前 景 并 不 乐观 。 事 实 上 ， 代 码 审 查 占 用 了 昂 员 的 代码 开发 时 间 。 毕 竞 ， 一 个 九 十 分 钟 
的 四 人 会 议 相 当 于 六 个 小 时 的 工作 时 间 一 一 一 个 人 一 天 工作 的 时 间 。 这 是 相当 大 的 时 间 投 入 , 所 
以 我 们 必须 要 问 问 这 样 做 的 好 处 是否 大 于 它 的 文 出 。 

羊 运 的 征 ， 我 们 有 相应 的 数据 。 在 过 去 的 十 年 中 ,我 们 对 于 如 何 有 效 地 执行 代码 审 碍 有 了 长 
足 的 进步 。 如 采 执 行 正 确 ,代码 审 碍 会 比 测 试 或 者 其 他 调试 技术 更 快 发 现 缺 陷 ; 但 如 来 代码 审查 
效率 低 ， 会 很 快 变 得 野 无 成 效 。 

本 项 调查 首先 会 给 出 各 类 代码 审查 都 适用 的 实践 , 从 正规 的 审查 到 程序 员 独 目 复 碍 目 己 的 代 
码 。 讨 论 完 这 些 基础 的 最 佳 实践 之 后 ， 我 们 会 讨论 团队 审查 中 的 数据 。 


18.2 程序 员 独 立 进行 小 量 代码 审查 


代码 审查 的 方法 有 成 二 上 万 种 ,但 有 一 种 是 基本 的 , 那 就 是 单独 一 个 程序 员 严 格 地 审查 代码 。 
所 以 , 讨论 一 下 程序 员 们 在 专心 致 志 、 不 与 别人 讨论 的 情况 下 审查 目 己 代码 的 统计 结 末 是 十 分 有 
意义 的 。 

当 程 序 员 独自 审查 代码 时 ， 哪 些 方法 最 有 效 ? 
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18.2.1 ”防止 注意 力 疲 劳 


一 次 代码 审查 应 该 花 多 少时 间 呢 ? 

图 18-1 表 示 随 着 时 间 的 推移 ， 发 现 缺 陷 效 率 的 变化 。 横 轴 表 示 时 间 ， 坚 轴 表 示 在 该 时 间 点 上 
所 发 现 缺陷 的 平均 数 。 

很 明显 ， 在 代码 审查 的 早期 ， 时 间 与 所 发 现 的 缺陷 数量 之 间 有 一 个 线性 关系 : (平均 ) 每 10 
分 钟 就 会 有 一 个 缺陷 被 找到 。 这 是 鼓舞 人 心 的 一 一 它 意 味 着 投入 代码 审查 的 时 间 越 多 ， 所 发 现 的 
缺陷 就 越 多 。 

让 我 们 在 这 里 停 下 来 思考 一 下 。 还 有 其 他 你 所 知 的 软件 开发 流程 能 够 每 10 分 钟 发 现 (HAL 
第 修改 好 ) 一 个 新 的 缺陷 吗 ? 当 然 没 有 ， 在 通常 的 软件 开发 /测试 环 市 中 ， 测 试 人 员 和 开发 人 员 
花费 的 时 间 远 远 不 止 这 些 。 

但 在 60 分 钟 左右 的 时 候 ， 突 然 出 现 一 个 下 降 。 这 个 时 间 点 之 后 ,每 10 分 钟 不 再 必然 发 现 另 一 
个 缺陷 。 发 现 缺陷 的 效率 急剧 下 降 。 

通常 用 来 解释 这 个 现象 的 理论 是 , 我 们 的 大 脑 大 约 一 小 时 就 会 疲倦 ; 在 技术 工作 上 集中 精力 
一 小 时 , 已经 是 很 长 一 段 时 间 了 。 所 以 不 管 是 什么 原因 ， 每 次 代码 审查 的 时 间 很 显然 不 应 该 超过 
一 个 小 时 。 














O 10 20 30 40 50 60 70 80 90 
时 间 (分 钟 ) 
图 18-1 60~90 分 钟 后 ， 我 们 发 现 错误 的 能 力 急 降 


18.22 ”切忌 速度 过 快 
逻辑 上 来 说 , 你 在 一 段 代 码 上 投入 的 时 间 越 长 ， 代 码 分 析 就 会 越 深入 和 细致 ， 发 现 的 代码 缺 
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陷 也 会 越 多 。 同 理 ， 如 果 代 码 审 查 十 分 仓促 ， 那 么 只 能 找到 最 浅显 的 错误 。 

那么 ,在 重要 的 问题 上 投入 充分 的 上 时间 追根 滴 源 ， 而 不 在 完善 的 代码 上 浪费 时 间 ， 这 两 者 之 
则 如 何 找 到 一 个 平衡 呢 ? 

图 18-2 是 一 项 基于 2500 份 代码 审查 的 研究 结果 ， 显 示 了 代码 审查 速度 对 于 发 现 缺 陷 能 力 的 
影响 一 。 

横 轴 表示 审查 速度 , 用 每 小 时 审查 的 代码 行 数 (LOC) 表示 。 紧 轴 表 示人 缺陷 密度 , 表示 每 1000 
行 代码 (kLOC) 发 现 缺陷 的 数量 。 这 里 用 “和 缺陷 密度 ”而 不 是 “缺陷 数量 ”， 因 为 审查 的 代码 越 
多 ， 目 然 会 发 现 越 多 的 缺陷 ， 所 以 用 “缺陷 密度 ”标准 化 了 不 同 长 度 代 码 的 审查 结果 。 

缺陷 密度 与 审查 速度 
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审查 速度 (代码 行 数 每 小 时 ) 
图 18-2 ”在 每 小 时 审查 400~500 行 代码 的 时 候 ， 发 现 缺 陷 的 效率 下 降 


在 每 小 时 0 行 与 大 约 400 行 代码 之 间 ， 缺 陷 蜜 度 均 匀 分 布 在 每 千 行 代码 0 个 和 100 个 缺陷 之 间 。 
这 征 符 合 预 期 的 。 比 如 说 ， 被 审查 的 代码 负责 往 一 个 接口 里 添加 文件 。 三 百 行 代码 中 可 能 只 有 很 
少 的 缺陷 或 者 投 有 缺陷 ， 也 束 是 说 ， 缺 陷 密 度 很 低 。 但 如 朱 被 审查 的 是 一 段 逻 辑 复杂 、 多 线程 、 
高 性 能 的 代码 ， 并 且 处 于 核心 模块 中 ， 整 个 应 用 都 依赖 于 这 个 模块 ， 那 情况 就 不 同 了 。 或许 只 
四 行 代码 被 改变 了 , 但 由 于 这 个 问题 的 复杂 性 ， 必 须 保证 它 是 正确 的 ， 几 位 审查 者 对 这 有 段 代码 吹 
毛 求 省 后 ， 好 不 容 多 挑 出 了 两 个 缺陷 ， 于 十 缺陷 密度 就 很 高 。 

简 而 言 之 ， 不 同 的 代码 审 碍 所 得 到 的 缺陷 密度 自然 会 有 差异 ， 所 以 这 样 的 分 布 是 很 合理 的 。 

审查 速度 一 旦 超过 每 小 时 400~500 行 代码 就 会 有 问题 。 突 然则 缺陷 密度 较 高 的 代码 审查 极 少 
出 现 。 当 然 不 是 因为 没有 缺陷 ， 而 古 因为 审查 速度 过 快 以 至 于 发 现 不 了 缺陷 。 











18.2.3 ”切忌 数量 过 大 


综合 之 前 的 两 个 结 未 ,我们 的 结论 息 : 如 末 每 次 审查 代码 的 时 间 不 能 超过 一 小 时 ,并 且 一 个 
小 时 之 内 审查 的 代码 数量 不 超过 400 行 ， 那 么 进行 一 次 代码 审查 就 不 能 超过 400 行 代码 。 

让 我 们 来 测试 一 下 这 个 听 起 来 不 钳 风 理论 。 

图 18-3 显 示 了 代码 审查 数量 对 缺陷 密度 的 影响 “。 与 上 一 部 分 的 结果 相似 ， 我 们 预计 缺陷 密 
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度 分 布 在 每 千 行 代码 0~100 缺 陷 。 但 古 当 审查 的 代码 数量 增加 时 ， 缺 陷 密 度 降低 。 正 如 我 们 预期 
的 那样 ， 这 个 时 间 点 大 约 在 300~500LOC 时 。 所 以 很 清楚 ， 那 时 代码 审查 的 效率 不 高 。 


代码 行 数 的 缺陷 率 (LOC) 
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图 18-3 ”当代 码 数量 增加 时 ， 我 们 发 现 缺陷 的 能 力 降低 了 。 所 以 一 次 不 要 
审查 超过 400 行 代码 


实验 结果 与 预期 十 分 吻合 ， 所 以 三 个 实验 结果 都 是 可 信 的 。 
18.24 ”上下文 的 重要 性 


前 用 的 版 本 控制 工具 Di 只 显示 改动 以 及 其 上 下 文中 的 几 行 。 即 使 是 最 复杂 的 工具 每 次 也 只 
MAR SCFF 
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回头 想 想 , 这 似乎 是 一 个 很 糟糕 的 实践 。 想 想 你 在 审查 单个 国 数 内 的 一 个 缺陷 修复 时 发 生 了 
什么 。 你 审 碍 了 改动 的 代码 ， 发 现 它 修复 了 原本 的 问题 ， 但 代码 审查 并 不 是 融 到 此 为 止 了 。 接 下 
来 的 问题 是 : 依赖 于 这 个 国 数 的 代码 会 不 会 依赖 于 原来 的 代码 ? 如 采 有 副作用 , 还 有 什么 其 他 代 
BRZI? 十 否 有 相应 的 单元 测试 ? 其 他 不 同 函 数 的 单元 测试 会 不 会 因为 这 里 的 改动 而 需要 
修改 ? 这 可 以 接受 吗 ? 

因此 ,与 只 审查 眼前 的 改动 相反 ， 审 查 代码 的 改动 对 于 其 他 文件 、 类 、 文 档 和 其 他 上 下 文 
的 影响 有 多 重要 呢 ? 一 项 实验 中 ， 审 碍 者 们 筝 握 了 各 种 不 同上 下 文 信息 一 一 与 当前 修改 相关 的 
文件 “。 它 用 了 一 个 简单 的 自动 化 工具 ， 基 于 调用 或 者 被 调用 的 方法 ， 产 生 了 “相关 文件 ” 列 
表 ， 这 样 多 发 现 了 15% 的 缺陷 。 当 人 为 来 判断 相关 文件 时 ， 可 以 多 发 现 30% 的 缺陷 。 

所 以 我 们 建议 不 要 孤立 地 进行 代码 审查 。 至 少 你 要 在 你 的 IDE (集成 开发 环境 ) 前 ， 可 以 看 
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到 所 有 的 代码 库 。 如 末代 码 的 作者 可 以 标 出 相关 代码 ， 那 么 时 间 的 利用 率 会 提高 。 


18.3 团队 影响 


至 此 ， 我 们 已 经 壮 虑 过 单个 程序 员 单 独 审查 代码 的 情况 ， 但 完整 的 流程 从 来 不 止 于 此 。 

实际 上 ,代码 审查 是 为 数 不 多 程序 员 共 同 完成 的 事情 之 一 。 对 于 代码 审查 来 说 ,这 点 本 壬 就 
很 有 趣 。 大 家 都 同意 一 定 程度 的 交互 合作 对 于 传播 学 术 知 识 ， 互 相 教授 各 种 技巧 ， 解 决 一 些 环 手 
的 问题 证 有 用 的 。 

但 如 来 说 浪费 一 个 人 的 时 间 古 吊 贯 的 , 那么 浪费 几 个 人 的 时 间 绝 对 是 毁灭 性 的 。 所 以 我 们 需 
要 看 一 下 相关 数据 ， 人 确保 没有 把 全 部 工作 时 间 都 冲 到 马桶 里 面 去 了 。 


18.3.1 是 否 有 必要 开会 


当 你 想到 代码 审查 的 时 候 ， 脑 海里 中 也 许 会 浮现 出 这 样 一 幅 画 面 : 会 议 室 中 , REA 
在 投影 仪 旁 ,一边 听 某 个 倒 考 的 程序 员 解 释 她 的 代码 ， 一 边 批判 她 。 

除了 代码 作者 本 身 的 处 境 不 让 人 羔 莫 之 外 ,这 样 的 方式 也 可 能 十 分 浪费 时 间 。Michael Fagan 
旧 导 的 传统 标准 审查 中 中 ， 其 过 程 的 核心 就 是 一 个 两 个 小 时 的 会 议 ， 有 四 个 与 会 者 来 讨论 代码 。 

四 个 人 两 个 小 时 的 会 议 意 味 着 八 个 人 时 一 一 相当 于 一 个 人 一 天 的 时 间 。 其 中 还 不 包括 事先 预 
定 会 议 室 和 等 待 迟到 人 员 的 时 间 。 这 样 做 的 话 最 好 能 赫 将 来 省 下 很 多 时 间 , 这 才能 证 明 这 个 流程 

在 Fagan 的 理论 中 会 议 是 必需 的 ， 不 只 是 为 了 方便 。 他 的 理论 是 当 四 个 人 在 一 起 的 时 候 ， 会 
产生 协同 效应 ( 原 话 )， 团 体 的 力量 大 于 四 个 人 加 起 来 的 力量 。 相 当 于 会 议 室 中 有 第 五 个 人 , 一 
个 虚拟 的 人 ， 能 够 找 出 单独 一 个 人 找 不 到 的 缺陷 ，Fagan 把 这 第 五 个 人 称 作 “幽灵 审查 者 ”。 

这 是 一 个 听 上 去 很 炫 的 理论 ， 但 真 的 是 这 样 吗 ? 不 幸 的 是 ，Fagan 并 没有 给 出 相关 数据 ，17 
年 之 后 才 有 相关 数据 发 布 “。1993 年 Lawrence Votta 统 计 了 代码 审查 会 议 之 前 发 现 的 缺陷 数量 ( 当 
人 们 自己 审查 代码 时 ) 和 会 议 中 发 现 缺陷 的 数量 。 结 果 如 图 18-4 所 示 。 

96% 的 缺陷 是 自己 审查 代码 时 发 现 的 ， 而 不 是 在 会 议 中 。 回 想 一 下 这 么 说 是 有 道理 的 ， 你 发 
现 隐 匿 缺 陷 的 时 候 ， 应 该 是 在 独自 关注 代码 , 而 不 是 与 一 群 人 在 一 起 浏览 代码 ,同时 还 要 跟 上 代 
码 作者 对 代码 的 解释 。 

Fagan 理 论 值得 赞扬 的 是 ， 他 发 现 会 议 中 发 现 的 代码 缺陷 往往 更 加 隐匿 ， 意 味 着 之 后 发 现 和 
修改 它 的 工作 量 很 大 。 但 是 ,除了 那些 最 关键 的 代码 之 外 ,程序 员 亲 自 参 与 会 议 不 划算 ， 太 浪费 
时 间 。 


18.3.2 ”虚假 缺陷 


虽然 会 议 形式 的 代码 审 碍 从 消耗 的 时 间 来 看 并 疫 有 发 现 足 够 多 的 缺陷 ， 但 是 却 有 另 一 个 作 
H: 它 可 以 修正 虚假 缺陷 ， 审 碍 者 认为 是 一 个 问题 ， 事 实 上 却 不 征 。 虚 假 缺陷 严重 影响 效率 ， 
为 它 需要 程序 员 人 花 时 间 修正 ， 并 可 能 在 这 个 过 程 中 引入 真正 的 缺陷 。 
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审查 阶段 发 现 的 缺陷 


I 


A 


2 


所 有 缺陷 的 百分比 
上 





图 18-4 ”Votta 展 示 了 代码 审查 会 议 额 外 发 现 缺 陷 的 数目 只 占 所 有 被 发 现 缺陷 的 4% 


Votta 在 他 的 研究 中 发 现 ”， 会 议 之 前 认为 是 缺陷 的 问题 有 25% 都 不 是 问题 ， 是 审查 者 理解 有 
误 。 除 了 Votta， 其 他 一 些 研究 也 发 现 该 比率 在 15% 到 30% 之 间 9 。 

占 题 就 是 修改 这 些 虚 假 缺 陷 的 代价 是 什么 ? 这 些 代 价 会 比 会 议 本 身 所 耗 的 时 间 大 吗 ? 

一 般 来 说 ， 如 果 一 个 人 对 于 一 段 代 码 很 疑 恶 ， 那 么 其 他 人 很 有 可 能 也 会 疑 避 。 那 么 ， 如 果 加 








入 一 句 注 释 就 可 以 解决 这 个 同 题 ， 还 是 很 值得 花 这 个 时 间 的 。 

毕竟, 在 同一 个 房间 里 开会 并 不 是 发 现 虚假 缺陷 的 唯一 方法 。 只 要 审查 者 和 代码 作者 可 以 通 
过 电话 、 邮 件 、 或 者 其 他 工具 进行 沟通 ,他们 就 可 以 讨论 有 疑问 的 缺陷 ， 大 部 分 虚假 缺陷 就 会 消 
失 。 关 键 在 于 会 议 形式 的 审查 代码 是 没有 必要 的 。 


18.3.3 ”外 部 审查 真 的 需要 吗 


我 们 一 直 假 设 二 个 人 总 是 强 过 一 个 人 ， 但 真 的 是 这 样 吗 ? 

回 到 编辑 目 己 作品 的 比喻 上 , 你 目 己 的 确 不 能 看 到 屏 硕 上 的 错误 。 但 如 霖 把 它 打印 出 来 ,在 
不 同 的 媒介 中 查看 自己 的 作品 ， 往 往 问题 就 会 跳出 来 。 或 者 ,一 星期 之 后 ， 再 审查 日 己 的 作品 ， 
你 可 以 发 现 一 个 新 的 问题 。 这 适用 于 代码 审查 吗 ? 

这 是 一 个 很 重要 的 问题 ， 因 为 目 我 检查 的 时 耗 最 多 只 有 51 入 他 人 审查 时 的 一 半 。 

Cisco 的 一 个 研究 比较 了 300 个 进行 过 目 我 检查 的 代码 审查 结案 和 300 个 进行 非 日 我 检查 的 代 
码 审 查 结果 。 如 图 18-5 所 示 ， 自 我 检查 过 的 代码 缺陷 密度 是 韭 自我 检查 的 一 半 ， 这 表明 人 们 在 
检查 目 身 工作 时 发 现 了 一 半 的 缺陷 。 
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只 有 简单 的 “上 自我 检查 ”对 于 你 上 自己 来 说 是 否 充分 ， 见 仁 见 智 。 毕 竞 ， 其 他 审查 者 还 是 发 现 
了 很 多 问题 。 但 有 一 点 是 明确 的 : 目 我 检查 有 效 地 利用 了 时 间 ， 并 且 比 没有 目 我 检查 好 很 多 ， 
为 它 在 没有 任何 外 部 审查 时 就 能 发 现 一 半 缺 陷 。 
代码 作者 目 我 检查 对 于 缺陷 密度 的 影响 
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图 18-5” 当 程序 员 审 查 自己 的 代码 时 ， 他 们 会 发 现 其 他 审查 者 发 现 缺 陷 的 一 半 


18.4 结论 


对 于 所 有 的 软件 开发 流程 来 说， 问题 不 是“ 代码 审 碍 是 人 否 必 要 ， 而 是 “什么 时 候 进 行 代码 
是 有 效 的 ?最 佳 实践 的 方法 是 什么 ”。 
这 份 研究 报告 给 出 了 最 佳 实践 的 方法 ， 不 必 再 有 条 不 紊 地 、 无 意识 地 浪费 时 间 。 
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第 19 章 
公共 办 公 室 还 是 私人 办 公 室 


Jorge Aranda 


本 章 涉及 的 问题 似乎 很 简单 , 怎样 来 安排 办 公 室 的 空间 对 软件 团队 来 说 最 合适 ?我 们 一 般 认 
为 项 目的 成 绩 好 坏 是 由 团队 成 员 之 间 的 距离 和 互动 的 难 易 程度 决定 的 。 小 隔 间 办 公 室 、 家 庭 ( 电 
W) 办 公 室 、 公 共 办 公 室 以 及 其 他 的 一 些 办 公 室 的 安排 邦 在 交流 方式 上 有 着 各 自 的 取舍， 而 在 有 
些 极端 情况 下 (比如 成 员 距 离 较 远 的 分 布 式 团队 )， 要 想 进 行 交流 互动 几乎 只 能 靠 电子 通信 。 当 
PR, 我 们 也 知道 ， 就算 团 队 的 成 员 在 同一 个 城市 的 同一 个 办 公 室 内 ， 办公室 的 安排 布置 也 会 影响 
他 们 的 效率 。 ABA, 到 底 办 公 室 的 安排 布置 有 多 重要 ? 我 们 目前 又 擎 担 了 哪些 有 助 于 更 好 地 设计 
办 公 环 境 的 研究 结 东 ? 


19.1 私人 办 公 室 


有 一 种 说 法 是: 花 钱 来 改 矢 软件 开发 人 员 的 工作 环境 ， 那些 钱 就 古 日 白地 打 水 深 。 那 些 想 要 
拥有 独立 办 公 室 ， 可 以 关门 、 关 挥 电话 的 开发 人 员 既 目 人 负 又 傲慢 , EA ARK TC IESE. AIR 
你 真 的 给 每 个 人 一 间 漂 亮 的 办 公 室 【 先 不 说 哪儿 来 的 钱 和 空间 )， 他 们 又 会 开始 抱怨 茶水 间 不 够 
高 档 ， 要 么 就 是 自行 车 室内 停放 处 的 芹 位 太 少 ， 要 么 就 会 抱怨 显示 龙 屏 幕 上 会 反射 窗户 上 的 光 。 
最 后 ， 他 们 不 免 会 要 求 公司 供应 有 机 餐饮 、 本 地 出 产 的 食物 ， 并 要 求 公司 配备 按摩 师 ， 再 安 上 海 
和 详 球 池 ， 束 像 那 些 Google 的 员工 们 一 样 。 即 便 开 发 人 员 们 不 会 那么 过 分 ， 为 每 人 安排 一 同 办 公 室 
的 成 本 也 很 高 ， 比 小 隔 则 高 很 多 。 为 什么 公司 要 把 钱 伦 在 成 效 甚 徽 ， 甚 至 可 能 根本 没有 效 采 的 事 
情 上 呢 一 一 尤其 古 当 大 部 分 的 苋 争 者 都 没有 这 样 做 的 时 候 。 

可 能 你 已 经 知道 了 ， 但 我 仍然 要 说 其 实 这 样 做 有 一 个 非常 重要 的 理由 。 任 何 做 过 软件 开发 
的 人 都 知道 这 项 工作 有 多 复杂 ， 对 人 的 意识 要 求 有 多 高 。 有 时 候 开 发 人 员 面 对 的 问题 是 如 此 的 
错综复杂 而 又 高 度 抽 象 ， 他 们 必须 苍 虑 各 种 影响 以 及 后 条 ， 所 以 他 们 和 前 需要 全 身心 地 投入 到 
工作 之 中 ,直到 其 他 所 有 东西 都 开始 变 得 模糊 ， 时 间 悄 悄 溜 走 ， 此 时 此 刻 他 们 已 和 技术 合 二 为 
一 。Csikszentmihalyi 把 这 种 深度 专注 的 最 佳 状态 称 为 心 流 flow) ， 即 人 的 行为 、 技 能 和 目标 达 
到 了 和 谐 状 态 ， 并 让 目 己 充分 沉浸 于 这 种 状态 之 中 的 体验 。 如 来 你 昕 说 过 这 个 概念 ， 那 你 可 能 
也 知道 要 达到 这 种 “ 心 流 ” 状 态 需 要 时 间 和 和 努力， 而 且 这 个 状态 非常 脆弱 ， 对 于 进行 创造 活动 
































252 第 19 章 公共 办 公 室 还 是 私人 办 公 室 








的 人 来 说 极为 重要 。 
和 如果 开发 人 员 不 断 受到 各 种 干扰 (比如 劳 边 卡 座 的 交谈 声 、 电 话 铃 声 、 央 窒 罕 罕 吃 东 西 的 声 





音 或 者 食物 的 味道 等 )， 他 们 就 没 办 法 工作 。 当 然 他 们 自己 也 会 意识 到 这 一 点 ， 所 以 不 但 事情 做 
不 好 ， 最 后 还 会 因此 变 得 很 诅 趟 和 失落 ， 最 后 会 导致 更 多 的 问题 和 错误 。 

不 幸 的 是 , 在 通常 的 公司 环境 中 开发 人 员 难 以 达到 心 流 状态 。 有 很 多 研究 报告 称 开发 人 员 经 常 
受到 各 种 和 干扰， 其 中 我 最 喜欢 的 是 由 Andrew Ko, Rob DeLine 和 Gina Venolia 做 的 一 份 研究 。 “他 们 
在 90 分 钟 的 时 间 内 观察 ， 到 底 是 什么 情况 让 开发 人 员 们 把 注意 力 从 手头 的 工作 上 移 开 ， 要 么 是 因 
为 他 们 的 同事 过 来 打 断 他 们 ,要 么 就 是 因为 他 们 缺少 一 些 必 要 的 信息 所 以 被 堵 在 那儿 了 ,而 此 时 
又 可 能 要 去 打 断 他 们 的 同事 "1。 

这 些 研究 人 员 发 现 , 对 于 这 些 开 发 人 员 来 说 , 工作 的 进行 是 非常 零散 的 。 他们 不 断 地 被 打 断 ， 
而 且 他 们 也 不 断 地 打 断 别人 ， 以 便 能 找 出 需要 的 信息 。 他 们 会 为 Email、 即 时 消息 和 参观 办 公 室 
的 人 所 分 心 。 这 些 调查 结果 让 人 担心 的 地 方 还 不 止 如 此 一 一 调查 是 在 微软 进行 的 ,要 知道 为 每 个 
开发 人 员 提 供 私密 而 安静 的 空间 正 是 让 微软 引 以 为 傲 的 优点 。 可 以 想 家 ,普通 使 用 小 隔 间或 者 公 
共 办 公 室 的 软件 开发 组 织 中 ， 问 题 可 能 比 这 个 严重 得 多 。 

在 知道 了 这 样 的 一 些 结果 之 后 , 我 们 开始 着 手 设 计 一 套 办 公 室 布局 , 希望 能 尽量 满足 需要 独 
立 工作 的 开发 人 员 。 因 为 我 们 推论 : 独立 工作 就 意味 着 较 少 的 干扰 ， 也 就 意味 着 更 好 和 更 深 的 专 
和 注 ， 那 么 就 能 达到 更 高 的 效率 和 更 好 的 质量 。 这 样 的 办 公 室 有 什么 特点 ? 首先 ， 应 该 保证 每 个 开 
发 人 员 都 有 单独 的 办 公 室 ， 空 间 小 一 些 也 行 ， 而 且 要 有 可 以 关闭 的 门 。 当 然 ， 他 们 还 可 以 把 电话 
设置 成 静音 , 而 且 无 需 从 上 班 到 下 班 一 直 在 线 , 当 出 现 干 扰 的 时 候 , 他 们 有 权 自 行 选择 如 何 处 理 。 
当 需 要 团队 交流 的 时 候 ， 开 发 人 员 可 以 使 用 共享 的 空间 ， 比 如 会 议 室 。 此 外 ， 他 们 还 应 该 有 休闲 
的 空间 来 进行 社交 活动 或 者 稍 作 休息 以 便 进 入 下 一 段 的 专注 状态 。 这样 ,他 们 就 能 通过 独立 工作 
进入 深度 专注 状态 , 随 之 而 来 的 还 有 很 多 的 好 处 ， 比 如 更 高 的 效率 、 更 好 的 产品 质量 以 及 更 高 的 
团队 士气 。 

理论 不 错 ,但 是 有 没有 证 据 可 以 证 明 ? 碰巧 的 是 , 有 。 这 个 证 据 正 是 Tom DeMarco 和 Tim Lister 
的 软件 开发 名 著 《 人 件 》 的 核心 论点 之 一 。 

在 这 本 书 中 ，DeMarco 和 Lister 描 述 了 他 们 举办 多 年 的 软件 开发 人 员 竞 赛 , 题目 是 “在 最 短 时 
间 内 实现 一 系列 的 基准 打分 以 及 测试 代码 并 保证 最 小 的 故障 率 ”。 他 们 把 这 些 竞 赛 称 为 “编程 战 
争 游戏 ”(Coding War Games), 参与 者 们 必须 记录 下 他 们 使 用 的 时 间 , 在 他 们 宣布 任务 完成 之 后 ， 
产品 必须 经 过 验收 测试 。 开 发 人 员 们 “工作 在 他 们 自己 的 工作 区 域 , 在 正常 的 工作 时 间 进 行 ， 并 
且 编 程 语 言 、 工 具 、 终 端 和 计算 机 与 他 们 在 其 他 项 目 中 使 用 的 相同 ”。 

DeMarco 和 Lister 发 现 “竞赛 选手 们 之 间 的 差异 巨大 ”， 而 且 他 们 还 发 现 了 三 条 经 验 法 则 “ 似 
平 无 论 何 时 用 于 衡量 绩效 的 区 别 都 会 适用 ”“: 

O 最 好 选手 和 最 差 选手 的 成 绩 比 率 大 概 是 10 : 1; 


























O 声明 : 我 曾 用 整个 夏天 的 时 间 在 微软 研究 院 做 实习 研究 员 ， 与 Gina Venolia 一 起 在 Rob DeLine 的 编程 中 的 人 类 互动 
(Human Interactions of Programming) 小 组 中 工作 。 
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O 最 好 选手 比 中 等 选手 〈 即 成 绩 为 中 位 数 ) 的 成 绩 大 概 好 2.5 倍 ， 

O 中 等 选手 以 上 的 那 一 半 的 总 成 绩 与 另 一 半 的 总 成 绩 的 比率 大 概 是 2 : 1。 

更 重要 的 是 ，DeMarco 和 Lister 发 现 ， 成 绩 的 好 坏 不 是 由 编程 语言 、 工 作 的 经 验 年 限 、 年 薪 或 
者 曾经 提交 的 故障 数量 来 决定 的 。 反 而 与 工作 的 场所 和 成 绩 的 好 坏 关 系 密切 : 高 效 的 选手 通常 来 
自 同一 个 公司 ,而 这 个 公司 的 环境 通常 会 比 低 效 选手 的 公司 环境 要 好 。 他们 将 这 些 结果 制 成 表格 ， 
我 们 转载 于 此 ， 即 表 19-1。 


表 19-1 代码 战争 游戏 中 好 选手 和 差 选手 的 工作 环境 对 比 












































环境 因素 排名 在 前 25% 的 选手 排名 在 后 25% 的 选手 
尔 的 专属 工作 区 域 有 多 大 78 平 方 英尺 46 平 方 英尺 
这 个 区 域 是 否 足 够 安静 57% 的 选手 答案 为 是 29% 的 选手 答案 为 是 
这 个 区 域 是 否 足 够 私密 62% 的 选手 答案 为 是 19% 的 选手 答案 为 是 
你 的 电话 能 否 调 成 静音 52% 的 选手 答案 为 是 10% 的 选手 答案 为 是 
尔 能 不 能 把 电话 转 接 给 他 人 76% 的 选手 答案 为 是 19% 的 选手 答案 为 是 
尔 是 不 是 经 常 毫 无 意义 地 被 人 打 断 38% 的 选手 答案 为 是 76% 的 选手 答案 为 是 


De Marco 和 Lister 认 为 这 些 怀 人 的 结 末 只 能 证 明 二 者 有 相关 性 ， 但 古 无 法 证 明 有 因 采 性 。 正 如 
他 们 所 说 的 :“ 这 里 发 表 的 数据 并 不 一 定 可 以 证 明 更 好 的 工作 环境 可 以 市 来 更 高 的 效率 。 它 也 许 只 
代表 了 表现 更 好 的 人 更 容易 被 提供 更 好 工作 环境 的 公司 所 吸引 。 这 对 你 来 说 真 的 有 意义 吗 ?” 

这 些 关 于 私人 办 公 室 以 及 最 大 限度 免除 打扰 的 工作 环境 的 研究 结 琳 让 人 心动 不 已 , 而 且 办 公 
空间 布置 上 的 额外 成 本 也 由 增加 的 效率 补偿 了 。 但 是 故事 还 没 结 束 。 虽然 看 似 圆 满 结局 , (He Zl 
突然 杀 出 个 程 咬 金 ， 让 我 们 的 研究 进入 了 一 个 完全 不 同 的 方 癌 。 
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我 们 前 面 的 讨论 有 一 个 癌 题 ， 那 就 是 在 DeMarco 和 Lister 的 研究 中 ,每 个 人 都 “ 独 目 ”完成 任 
务 。 他 们 独 目 编写 代码 和 进行 测试 ， 而且 他 们 也 是 按 个 人 来 排名 的 。 要 想 做 好 开发 ， 唯 一 的 关键 
就 是 “一 个 人 ”尽量 集中 精神 ， 并 找到 最 佳 方法 。 

不 过 大 多 数 的 软件 开发 并 不 是 如 紫 。 开 发 人 员 们 并 不 是 单 兵 作战 ,每 个 人 都 古 团队 的 一 份子 。 
很 多 成 员 的 工作 都 有 交集 。 他 们 相互 帮助 ， 共 同 进 退 。 所 以 ， 在 项目 进行 的 过 程 中 ,团队 中 的 人 
们 都 需要 不 断 地 相互 沟通 和 协调 。 

这 种 沟通 和 协调 的 需求 可 能 会 非常 大 。 正 如 Brooks 在 《人 月 神话 》“ 中 指出 的 那样 ， 对 于 沟 
通 协 调 的 需求 太 大 了 , 以 至 于 在 项 目 后 期 加 入 新 的 成 员 可 能 反而 会 推 延 交 付 日 期 , 因为 此 时 加 入 
新 人 会 造成 很 多 额外 的 协调 开销 。 

对 协调 问题 的 思考 使 我 们 不 得 不 重新 审视 “私人 办 公 室 的 解决 方案 。 也 许 真 正 重 要 的 是 让 开 
发 人 员 们 有 一 个 可 以 一 直 高 效 地 相互 协调 和 交流 的 环境 。 比 起 专注 来 说 ,也 许 我 们 更 应 该 强调 协调 。 

有 很 多 理论 可 以 支持 这 个 论点 。 首 先 , 我 们 必须 记 住 在 Csikszentmihalyi 的 理论 中 并 没有 说 心 
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流 状 态 只 能 在 孤立 的 情况 下 才 会 产生 。 事实 上 ,和 谐 的 团队 精神 是 最 容易 进入 心 流 状态 的 途 公 之 
一 。 强 调 协 调 还 有 其 他 的 好 处 。 比 如 ， 社 会 心理 学 家 们 发 现 ， 有 亲密 关系 的 人 们 会 形成 一 种 被 称 
为 “交互 记忆 系统 ”(transactive memory system) “的 伙伴 关系 。 你 可 能 和 你 的 伴 但 或 者 家 人 经 
历 过 这 种 感受 : 有 的 人 【很 可 能 就 是 你 ) 成 为 了 “电脑 专家 ”， 有 的 人 会 专门 负责 记录 大 家 的 生 
日 ， 有 的 人 人 负 贡 账单 ， 等 等 。 在 交互 记忆 系统 中 的 人 们 往往 会 将 移 默 化 地 确定 每 个 人 的 专长 。 只 
要 专长 的 分 工 是 平衡 的 ， 那么 这 样 的 安排 束 会 很 高 效 。 人 们 不 必 知 道 每 件 事 情 怎 么 来 做 ， 他们 只 
Te AE iA al ERT OS. FERED A PALL OP, 一 直 保 持 亲 密 关 系 的 人 组 成 的 小 组 在 记忆 
测试 中 的 成 绩 会 比 陌生 人 组 成 的 小 组 要 好 。 这 样 的 一 个 效应 不 但 存在 于 个 人 关系 之 中 , 也 存在 于 
工作 关系 之 中 。 所 以 ， 如 果 团 队 的 成 员 们 相互 坐 得 很 近 ， 而 且 可 以 不 断 地 回答 队友 的 问题 ， 那 
么 他 们 就 更 容易 发 展 出 一 套 交 互 记 忆 系 统一 一 无 需 刻 意 ， 只 需 目 然而 然 。 

这 不 仅仅 意味 着 团队 发 展 出 了 所 谓 的 “团队 记忆 ”。 在 我 们 开始 思考 如 何 进行 高 效 的 协调 和 
沟通 之 后 ， 其 他 的 一 些 因 素 映 入 了 我 们 的 眼帘 。 一 个 因素 是 我 们 所 使 用 的 沟通 渠道 的 丰富 性 。 根 
据 两 位 Olson 的 说 法 ， 虽 然 我 们 现在 有 很 多 技术 可 以 帮助 我 们 进行 还 程 协 作 ， 但 是 距离 仍然 是 个 
问题 ， 没 有 什么 比 面对面 的 合作 更 高 效 。 事 实 上 ， 他 们 还 进一步 地 预测 ， 在 接 下 来 的 数 十 年 里 ， 
距离 的 回 题 仍然 会 很 重要 一 一 即便 我 们 实现 了 所 有 合理 可 行 的 远 距 离 协 作 技 术 。 当 谈话 双方 处 于 
同一 个 环境 下 的 时 候 ， 双方 交换 的 信息 比 他 们 有 意识 想 要 表达 的 信息 要 多 得 多 ,而 这 些 信息 的 通 
畅 对 工作 效率 和 质量 都 有 很 大 的 影响 。 

Herbsleb 和 Grinter 曾 研究 过 一 个 项 目 ， 由 于 无 法 进行 即时 的 交流 ， 最 后 出 现 了 问题 。 他 们 研 
究 了 一 个 成 员 处 于 不 同 地 域 的 分 布 式 开发 项 目 在 整合 代码 上 的 困难 , 并 总 结 说 整合 代码 是 这 个 项 
目 中 最 困难 的 部 分 ， 因 为 非 正 式 交流 渠道 的 中 断 造 成 了 很 多 协调 的 问题 ”“。 他 们 的 研究 报告 并 没 
AMITA RA. 

他 们 的 研究 适用 于 任何 成 员 分 散 得 很 远 的 项 目 , 但 是 我 们 也 可 以 提出 疑问 ， 即 如 果 人 们 在 同 
一 办 公 地 点 的 不 同 办 公 室 工作 , 非 正式 的 交流 渠道 也 会 出 回 题 吗 ?如 末 使 用 独立 办 公 室 的 话 , AE 
正式 的 交流 渠道 真 的 会 受 那 么 大 的 影响 吗 ? 

WAKA Hel], 但 是 并 不 会 像 不 同 地 理 位 置 那 么 大 。 这 里 有 一 个 同 题 ， 那 就 是 如 果 人 们 离 你 
的 办 公 桌 超过 了 人 简短 步行 的 距离 (大概 30 米 )， 你 就 可 能 当 他 们 在 另 一 个 城市 ， 也 就 是 说 ， 你 去 
找 他 们 聊天 或 者 问 问 题 的 机 率 就 会 直线 下 降 ' 1。 两 位 Olson 列 出 了 在 工作 地 点 不 同时 , 很 多 其 他 造 
成 交流 失灵 的 原因 : 他 们 没 办 法 迅速 获得 反馈 、 设 办 法 利用 更 多 的 交流 方式 、 没 办 法 获取 微妙 的 
信息 、 没 办 法 了 解 很 多 隐 性 的 上 暗示 ， 等 等 。 当 人 们 篆 各 不 在 同一 个 房间 的 时 候 ， 他 们 的 交流 的 效 
率 就 要 低 一 些 。 他 们 的 凝 肾 力也 会 变 差 , 而 我 和 我 的 同事 们 曾 推论 凝聚 力 可 能 是 软件 开发 组 织 成 









































功 的 重要 因素 站。 
敏捷 思想 的 追随 者 们 总 是 强调 这 几 点 。 他 们 呼吁 持续 不 断 而 且 足 够 充分 的 互动 , 而 大 部 分 其 








至 所 有 的 敏捷 方法 都 强调 了 团队 配置 的 重要 性 。 尤 其 是 Beck 的 极限 编程 方法 , 这 种 方法 明确 地 推 
荐 了 各 种 相关 实践 ， 比 如 在 整个 项 目 进行 过 程 中 团队 应 该 “ 坐 在 一 起 ”(Sit Together) ， 工 作 地 点 
都 在 “ 富 含 信息 的 工作 空间 ”(Informative Workspace) 外 。 有 些 敏捷 的 支持 者 认为 (出 于 直觉 或 
者 出 于 经 验 )， 虽 然 相互 配合 会 分 散 注意 力 ， 但 是 仍然 比 孤军 作战 要 好 。 可 是 ， 有 什么 直接 证 据 
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可 以 文 持 这 种 说 法 吗 ? 

我 匈 过 最 有 力 的 证 据 来 目 于 Teasley 等 人 做 的 一 份 研究 。 在 这 次 研究 中 , 他 们 调 奋 了 一 家 入 选 
《财富 》 百 强 的 汽车 公司 ， 这 家 公司 愿意 尝试 “作战 室 “的 做 法 。 这 家 公司 先是 做 了 一 个 试点 项 
目 , 后 来 将 这 个 做 法 推广 到 了 公司 中 的 大 部 分 项 目 。 作 战 室 为 每 位 项 目 成 员 都 配备 了 电脑 ， 大 部 
分 人 都 围 着 一 个 大 办 公 果 坐 ， 墙 上 挂 着 白板 。 劳 边 还 有 一 些 私密 的 小 隔 间 ， 和 钾 有 电话 和 电脑 ， 如 
本 成 员 需 要 安静 或 者 隐私 的 时 候 , 也 可 以 选择 这 些小 隔 间 。 人 研究 人 员 们 进 踊 调查 了 数 个 效率 的 指 
标 ， 以 及 团队 成 员 们 对 于 作战 室 的 满意 程度 “。 

试点 团队 的 结 末 出 奇 地 好 : 他 们 的 效率 超出 了 公司 标准 的 两 倍 ， 虽 然 也 有 少 部 分 成 员 不 满 ， 
但 是 大 部 分 还 是 很 喜欢 作战 室 。 他 们 对 于 相互 之 间 越 来 越 密集 的 互动 逐 独 适应 ,并且 认为 这 样 的 
办 公 室 比 以 前 的 旧式 小 隔 间 办 公 室 要 好 。 在 这 个 做 法 被 制度 化 了 以 后 , 后 续 团 队 的 成 绩 比 试 后 团 
队 的 “更 好 "， 在 保持 团队 满意 度 不 变 的 情况 之 下 ， 所 有 的 效率 指标 都 得 到 了 长 是 的 提升 。 这 种 
激进 的 安排 方式 取得 了 成 功 ， 这 一 点 和 其 他 的 科学 研究 中 报告 的 一 致 。 

你 可 能 会 想 , 那 还 有 关注 度 和 心 流 状态 的 问题 呢 。 之 前 不 古 说 公共 办 公 室 会 造成 很 大 的 干扰 
吗 ? Chong 和 Siino 研 究 了 这 个 问题 :他们 对 比 了 结对 (而 且 紧 密 地 安置 在 一 起 ) 的 程序 员 和 单个 
程序 员 的 干扰 问题 。 人 研究 发 现 ， 在 结对 工作 环境 下 的 干扰 有 所 不 同 。 比 起 单独 工作 的 人 来 说 , 结 
对 编程 的 人 们 受到 的 干扰 时 间 更 短 , 受到 的 干扰 和 工作 的 相关 性 也 更 高 。 结对 编程 的 程序 员 们 所 
处 的 公共 办 公 室 确实 要 比 单个 程序 员 的 小 隔 间 办 公 室 要 哮 杂 一 些 , 但 是 结对 程序 员 们 都 “适应 了 
工作 环境 ， 只 有 在 其 他 人 高 声 喧 哗 时 才 会 受到 干扰 。 Chong 和 Siino 还 发 现 对 于 独立 工作 的 程序 
员 来 说 ， 只 要 有 人 走 到 小 隔 则 来 ， 就 会 影响 到 小 隅 间 内 的 人 ,无论 这 个 人 当时 是 在 干什么 。 相 比 
之 下 , 公共 办 公 室 环境 下 的 结对 程序 员 们 会 告诉 可 能 打 断 他 们 的 人 什么 时 间 来 最 好 ,什么 时 间 他 
们 在 做 事 不 要 来 干扰 。 

就 这 些 证 据 来 看 ,这 样 的 公共 办 公 室 确实 是 有 好 处 的 。 团 队 坐 在 同一 个 办 公 室 , 全 部 人 都 围 
绕 在 一 个 或 者 两 个 大 型 办 公 时 前 而 不 必 分 区 ,宽阔 的 墙 上 放 着 白板 , 还 有 少量 私密 办 公 室 供 那 些 
确实 需要 隔离 的 人 们 使 用 。 看 来 ， 这 种 布局 可 以 最 大 限度 的 发 挥 他 们 的 协调 和 认 知 能 


19.3 工作 模式 


ABZ BEEZ lS? 结论 有 点 目 相 矛盾 : 我 们 先是 提 到 了 独立 办 公 室 的 好 处 ,并 称 开发 人 
员 应 该 尽量 集中 注意 力 , 后 来 我 们 又 把 论点 转 到 了 聚拢 和 公共 空间 的 好 处 上 , 又 称 开发 人 员 应 该 
尽量 多 考虑 协调 能 力 。 有 哪个 环 东 出 问题 了 吗 ? 
也 许 “ 工 作 模 式 ” 可 以 提供 一 些 线索 。 根 据 Tesluk 等 人 的 研究 来 看 ， 团 队 的 工作 流程 可 以 被 
分 为 数 个 类 别 ， 这 个 分 类 基于 团队 成 员 所 需要 参与 的 互动 类 型 。 具 体 分 类 如 下 : 
esUUUUUUDO 
每 个 人 的 任务 将 会 汇总 到 团队 的 级 别 ,在 这 种 模式 中 ,团队 成 员 之 间 无 需 交 互 或 者 交流 。 





























“作战 室 ” 这 个 词 有 种 激进 的 意味 在 里 面 ， 所 以 我 更 喜欢 使 用 “公共 办 公 室 ”这 个 说 法 ， 不 过 二 者 的 意思 都 是 一 
样 的 。 
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*HUUUUUU 
任务 从 一 个 成 员 传 递 到 下 一 个 成 员 ， 但 古 不 会 反 过 来 。 
*HUUUUUU 
AUPE, TES HT Ra, TE BUA 
*HUUUUU 


任务 将 会 有 可 能 经 手 所 有 的 组 员 ， 而 全 体 组 员 也 必须 合作 来 完成 任务 。 


当然 ,这 样 的 分 类 仅仅 古 理 想 分 类 ， 团队 一般 不 会 正好 属于 茶 一 类 。 虽 然 说 项 目的 具体 分 类 
必须 考虑 其 实际 的 流程 和 操作 , 但 是 一 般 来 说 软件 项 目 倾 癌 于 后 两 类 。 很 少 有 软件 项 目 可 以 采用 
汇总 或 者 顺序 式 的 工作 流程 。( 顺 序 式 工 作 流 程 的 例子 古 纯 粹 的 瀑布 模式 ， 即 不 允许 回 到 项 目前 
一 阶段 的 开发 模式 。) 但 是 互 患 式 工作 流程 则 比较 靠近 现实 世界 中 的 汇 布 及 曙 旋 开发 模式 ， 而 窗 
集 工作 流程 则 更 像 是 敏捷 开发 方法 。 

这 一 扩 人 很 重要 ， 因 为 据 我 们 所 知 ， 工 作 尝 程 越 症 密集 的 团队 ， 越 十 需 要 现场 的 协调 。 在 一 份 
详细 的 研究 文献 中 ，Beal 等 人 总 结 道 ， 对 于 那些 工作 流程 非常 复杂 的 团队 来 说 ， 其 凝聚 力 与 效率 
之 间 有 紧密 的 关联 ， 但 是 对 于 那些 工作 流程 简单 直接 的 团队 来 说 则 不 一 定 。 

想 想 你 上 一 个 软件 项 目 。 古 不 十 每 个 团队 成 员 部 对 项 目 要 求 以 及 目 己 的 任务 有 着 清楚 的 认 
识 ? 他们 十 否 知道 问 谁 来 询问 他 们 需要 的 信息 ?他 们 古人 否 知 道 目 己 负 责 的 工作 该 如 何 和 其 他 队 
友 的 工作 对 接 ? 有 没有 一 个 信息 库 可 供 他 们 和 碍 询 信 息 以 及 这 个 信息 库 征 否 有 用 ? SR Ae 
EAE, CVPR] TPS, mR Rab, WIRE AE GENTE, IBA LE 
MAEM Oa le) TERN, Wal ris KEEL 

我 们 还 可 以 使 用 另外 一 个 方法 来 看 这 个 问题 .想象 一 个 项 目 , 这 个 项 目 没 有 任何 明确 的 要 求 ， 
对 于 这 个 软件 能 做 什么 只 有 一 个 大 概 的 想法 。 它 也 没有 明确 的 完成 日 期 , 团队 只 需 承 诺 尽 可 能 
地 持续 向 客户 交付 新 的 功能 。 此 外 ,你 和 你 的 队友 相互 之 间 不 其 了 解 ， 你 们 以 前 没有 长 时 间 合 作 
过 ， 而 你 也 不 知道 每 个 人 的 优点 和 缺点 。 现 在 ， 想 象 每 个 成 员 都 把 自己 锁 在 一 间 独 立 的 办 公 室 
里 ， 这 样 就 营造 了 一 个 拒绝 任何 干扰 《无 可 避免 的 除外 ) 的 环境 。 在 这 样 的 条 件 之 下 你 怎么 来 
做 事 呢 ? 

现在 ,想象 一 个 相反 的 状况 : 团队 很 明确 地 知道 需要 做 些 什 么 ,规范 分 档 非 党 全 面 而 且 制 作 
仔细 ， 每 个 人 都 分 工 明确 ,而且 由 于 有 了 仔细 的 规划 ， 整 合 应 该 也 不 会 有 什么 问题 。 只 需 你 和 你 
的 队友 们 每 天 花 几 个 小 时 独立 专注 于 目 己 的 任务 , 这 个 项 目 就 可 以 完美 地 进行 , 但 是 你 却 坐 在 一 
个 公 蕉 办 公 室 里 面 ， 不 停 地 被 干扰 和 打 断 。 在 这 样 的 条 件 之 下 你 怎么 来 做 事 呢 ? 

可 惜 的 是 ， 还 没有 人 研究 可 以 提供 一 个 明确 的 准则 来 指导 我 们 如 何 根 据 团 队 的 不 同 来 进行 选 
择 。 从 现在 已 有 的 证 据 来 看 , 我 们 最 多 只 能 说 , 只 要 和 团队 的 工作 方式 搭配 得 当 , 那么 不 管 是 “ 私 
人 人 办公室” 还 是 “公共 办 公 室 "， 两 种 空间 安排 邦 可 以 之 来 好 的 结果 。 如 末 你 致力 于 使 用 密集 式 
工作 流程 (或 者 你 当前 的 环境 要 求 你 使 用 它 )， 那 么 你 应 该 尽量 满足 密集 的 协调 工作 ， 而 如 末 你 
更 偏 癌 于 顺序 式 或 者 互惠 式 的 工作 流程 , 那么 你 应 该 保证 开发 人 员 能 够 专注 于 自己 的 工作 , 并 将 
他 们 之 则 的 联系 削减 到 少数 必要 的 事情 上 。 
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19.4 最 后 的 忠告 


关于 “公共 办 公 室 还 是 私人 办 公 室 ” 这 个 问题 ， 管 案 是 “ 虱 可 以 ”。 也 就 是 说 ， 虽 然 二 者 完 
全 不 同 ， 但 是 却 都 大 大 优 于 现在 很 流行 的 隔 加 农场 式 排 布 。 

小 隔 间 的 问题 是 它 拥 有 前 面 两 种 布置 方式 的 种 种 缺点 , 但 是 却 不 具备 二 者 的 任何 优点 。 首 先 ， 
小 隅 间 并 不 像 私 人 办 公 室 那样 把 开发 人 员 们 隔离 开 来 , 所 以 他 们 第 第 会 被 周遭 的 对 话 所 干扰 。 但 
古 它 又 不 古 真 正 的 共享 空间 ， 所 以 人 们 也 无 法 连续 地 进行 协调 交流 ,而 这 一 点 公共 办 公 室 可 以 做 
到 。 据 我 所 知 ， 对 于 软件 开发 来 说 ,没有 任何 研究 表明 小 隔 间 要 优 于 其 他 的 办 公 空 间 安 排 , 我 们 
应 该 尽量 吉 人 免 使 用 这 种 安排 方式 。 要么 选择 专注 , 要 么 就 选择 协调 。 如 果 两 者 邦 不 选 那 就 亏 大 了 。 
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第 20 章 


识别 及 管理 全 球 性 软件 
开发 中 的 依赖 关系 


Marcelo Cataldo 


全 球 性 软件 开发 (GSD) 正在 普及 。 由 于 可 以 降低 成 本 、 招 募 各 地 的 人 才 、 开 拓 新 市 场 ， 大 
大 小 小 的 公司 都 开始 走 上 了 GSD 的 道路 。 但 是 , 想 要 让 分 布 在 世界 各 地 成 百 上 千 的 项 目 人 员 协 同 
合作 ,说 起 来 容易 做 起 来 难 。 实 际 上 ， 在 GSD 的 环境 中 协调 设计 和 开发 工作 是 极 具 挑 战 性 的 。 这 
方面 例子 很 多 : 有 很 多 产品 被 扰 杀 在 了 袜 修 之 中 ,还 有 些 花 费 了 双 倍 的 时 间 才 完成 。 值 得 庆 反 的 
是 ， 在 过 去 的 二 十 年 中 我 们 得 到 了 很 多 关于 如 何 更 好 地 利用 GSD 的 经 验 教 训 。 

本 章 有 两 个 目标 。 首 先 , 我 们 将 用 各 类 实证 研究 证 明 : 要 想 有 效 地 协调 GSD 环 境 下 的 开发 工 
作 ， 就 必须 综合 对 软件 项 目的 “技术 ”和 “社会 一 组 织 ” 两 个 方面 的 认识 。 然 后 ， 我 们 将 论述 如 
何 将 这 些 研究 结果 转化 为 一 套 实 用 的 方法 ， 并 运用 到 GSD 中 的 各 种 角色 和 各 个 阶段 。 

我 们 将 用 “社会 一 技术 一 致 性 ”(Socio-Technical Congruence, STC) 这 个 概念 将 本 章 的 各 部 
分 内 容 联系 起 来 。 那 么 ， 在 开始 之 前 我 们 先 来 介绍 一 下 这 个 概念 。STC 指 的 是 从 技术 环境 中 所 产 
生 的 协调 需求 与 项 目的 社会 一 组 织 结构 可 以 提供 的 协调 能 力 之 间 的 关系 。STC 主 张 : 当 一 个 项 目 
的 协调 需求 和 协调 能 力 相 匹 配 的 时 候 , 项 目 会 取得 更 好 的 成 绩 , 例如 更 好 的 产品 质量 或 者 更 高 的 

最 后 , 我 们 还 将 介绍 STC 所 推荐 的 一 套 标 准 来 衡量 协调 需求 、 协调 能 力 以 及 它们 之 间 的 关系 。 
在 本 章 中 ， 我 们 将 在 实践 环境 中 来 讨论 这 些 因素 。 


20.1 为 什么 协调 工作 对 于 GSD 来 说 是 挑战 


大 型 的 跨 站 点 或 者 跨 组 织 的 项 目 已 经 存在 了 几 十 年 了 。 在 20 世 纪 50 年 代 那 会 儿 , 组 织 结构 方 
面 的 研究 人 员 们 最 先 想 要 解决 的 问题 是 如 何 安排 好 各 种 工作 。Galbraith March, 、Simon 和 
Thompson 等 研究 人 员 声 称 ， 要 想 安排 好 工作 ， 就 必须 尽量 减少 项 目 或 者 组 织 的 任务 之 间 的 相互 
依赖 性 。 他 们 的 研究 指出 : 在 必须 要 做 协调 的 时 候 ， 我 们 如 有 果 能 预先 知道 任务 包含 哪些 步骤 和 各 
个 任务 之 加 的 相互 依赖 关系 ， 就 可 以 使 用 标准 作业 流程 (standard operating procedure) 一 类 的 机 
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制 来 管理 相互 依赖 关系 并 有 效 地 协调 工作 。 但 是， 当 出 现 特殊 情况 或 者 任务 的 内 容 并 不 明确 的 时 
修 ， 我 们 就 需要 更 具 弹 性 的 协调 措施 了 ， 比 如 项 目 成 员 之 间 的 直接 交流 或 者 会 议 等 。 

后 来 , Malone 和 Crowston [1994] 又 提出 了 其 他 的 一 些 协调 方法 , 例如 用 传统 的 软件 概念 来 给 
工作 依赖 关系 分 类 (如 “资源 共享 关系 ”或 者 “生产 者 /消费 者 关系 ”等 )， 并 根据 不 同 的 类 别 使 
用 不 同 的 协调 策略 。 

在 技术 领域 中 ， 模 块 化 系统 设计 方面 的 研究 也 提出 了 非常 类 似 的 观点 。 比 如 ，Parnas 很 早 就 
tH: 系统 应 该 被 分 解 为 较 小 的 单元 〈 如 模块 ) ， 而 这 些 单元 之 间 的 依赖 关系 应 该 尽量 减少 。 
在 这 种 情况 下 ,依赖 关系 的 表现 形式 就 下 每 个 单元 或 者 和 便 蕊 所 公开 的 接口 。 只 要 在 项 目 开始 的 时 
伐 就 明确 地 定义 好 这 些 接口 并 保持 稳定 ,那么 各 个 单元 的 开发 束 可 以 同时 进行 。 如 来 需要 做 修改 ， 
那么 我 们 可 以 启用 协调 机 制 (比如 会 议 ) 来 把 有 关 各 方 召集 在 一 起 讨论 一 个 大 家 都 同意 的 接口 修 

改 方案 。 

前 面 讨论 的 古 在 今天 的 任何 组 织 结构 (包括 软件 项 目 ) 中 都 能 找到 的 最 老生 币 谈 的 一 种 协调 
机 制 。 但是， 软件 开发 中 的 协调 工作 还 面临 着 独特 而 严峻 的 问题 ,这 些 问 题 主 要 来 日 于 软件 项 目 
的 技术 和 社会 两 方面 之 间 的 复杂 关系 。 

我 们 都 知道 , 在 软件 项 目 中 , 我 们 对 于 需求 的 认识 和 理解 通 前 征 随 着 项 目的 进行 而 不 断 改变 、 
不 断 完善 的 。 随 着 需求 的 变化 ,正在 开发 的 系统 的 结构 也 随 之 变化 和 发 展 。 这 种 不 确定 性 以 及 变 
化 和 发 展 所 市 来 的 复杂 性 是 一 个 很 大 的 问题 , 使 得 了 解 不 同 的 项 目 部 件 之 间 的 依赖 关系 并 有 效 地 
管理 它们 变 得 非常 困难 。 

比如 de Souza 等 人 “和 Grinter 等 人 ”在 研究 了 多 个 软件 项 目 之 后 发 现 ， 很 多 开发 人 员 完 全 搞 
不 清楚 他 们 的 修改 会 对 系统 的 其 他 部 分 以 及 这 些 部 分 所 对 应 的 开发 任务 造成 什么 影响 。 这 种 协调 
不 力 的 情况 间 毅 会 使 项 目 在 集成 和 测试 阶段 出 现 各 种 问题 ， 有 时 候 还 会 出 现 很 严重 的 问题 。 

软件 项 目 中 存在 的 协调 问题 在 全 球 性 项 目 中 更 是 严重 ， 原 因 如 下 。 

CO 地 理 上 的 间隔 使 得 项 目 成 员 们 无 法 简单 地 下 楼 和 其 他 成 员 进 行 交 流 、 讨 论 问题 或 者 了 解 

软件 变更 的 情况 。 

O 时 区 的 差别 也 会 妨碍 信息 的 交换 和 有 效 的 协调 。 

O 当 无 法 进行 同步 的 沟通 (如 电话 会 议 ) 时 , 人们 就 不 得 不 使 用 异步 的 交流 方式 (如 Email)， 

这 更 容易 导致 错误 或 者 误解 。 

口 一 个 项 目 所 涉及 的 部 门 或 者 办 公 地 点 越 多 ， 组 织 上 的 障碍 (如 不 同 的 管理 、 激 励 机 制 和 

目标 ) 就 越 容易 造成 项 目 成 员 沟 通 和 协调 的 不 畅 。 

总 之 ,我们 必须 认真 对 竺 软件 项 目 中 的 协调 问题 。 此 外 要 注意 的 证 ，GSD 的 固有 特 氮 还 会 加 
重 这 个 问题 。 


20.2 依赖 关系 及 其 社会 /技术 二 重 性 


在 设计 和 实现 复杂 的 软件 系统 时 ,我 们 需要 考虑 各 个 组 成 部 分 之 间 的 各 种 依赖 天 系 。 而 开发 
人 员 、 管 理 者 和 其 他 利益 相关 者 通 并 无 法 识别 和 处 理 所 有 这 些 依赖 关系 。 这 些 回 题 通 前 会 导致 较 
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低 的 生产 力 ， 因 为 他 们 需要 更 多 地 返工 ， 还 需要 更 多 的 时 间 来 进行 集成 和 测试 “……” 。 我 们 也 
常常 看 到 其 对 软件 质量 的 影响 ， 比 如 未 被 发 现 的 依赖 关系 会 导致 更 多 的 缺陷 -。 

在 软件 开发 中 ， 所 有 人 都 会 面临 的 严峻 挑战 就 是 识别 依赖 关系 。 这 并 不 容易 ， 因 为 这 涉及 两 
个 相关 的 方面 : 一 个 是 技术 部 分 ， 一 个 是 社会 一 组 织 部 分 。 比 如 ， 有 时 候 依赖 关系 的 技术 本 质 会 
让 其 难以 被 发 现 。 一 个 典型 的 例子 就 古 在 两 个 组 件 之 间 的 异步 远程 调用 (ARPC)。ARPC 会 产生 
时 机 、 锁 定 以 及 资源 消耗 方面 的 依赖 关系 ， 但 是 这 种 依赖 关系 可 能 只 有 在 出 了 相关 的 问题 之 后 ， 

SBIR ATA EFI 

还 有 一 些 依赖 关系 古 在 社会 一 组 织 方面 的 ， 和 组 织 内 部 的 工作 安排 及 执行 方式 有 关 。 比 如 ， 
组 织 上 第 第 会 基于 开发 资源 的 可 用 性 来 分 配 任 务 。 这 样 就 可 能 造成 任务 之 间 的 依赖 关系 ， 比 如 在 
世界 上 两 个 不 同位 置 ， 甚 至 是 几乎 没有 共同 的 工作 时 间 段 的 两 个 地 区 (即时 差 大 于 7 一 8 个 小 时 ， 
比如 美国 和 印度 ) 的 人 员 对 信息 共享 的 需求 。 在 这 种 情况 下 ， 这些 依赖 关系 的 问题 就 无 法 在 工作 
时 间 解 决 了 。 

为 了 说 明 识 别 软件 项 目 中 依赖 关系 的 一 些 难点 , 我 们 可 以 参考 一 人 Bass 等 人 提出 的 这 个 在 众 
多 大 型 开发 项 目 中 有 着 典型 意义 的 例子 ”。1 号 系统 是 一 个 软件 平台 ， 用 于 支持 一 系列 实时 租 入 
式 产 品 。 由 于 平台 的 技术 需求 范围 广泛 〈 支 持 各 种 功能 、 内 存 需求 、 时 间 需 求 ， 等 等 )， 可 以 预 
见 的 是 新 的 功能 将 会 定期 地 被 加 入 进来 。 

架构 团队 使 用 了 在 此 前 的 项 目 中 已 经 成 功 实践 过 的 各 种 方法 来 设计 1 扎 系 统 。 这 个 系统 由 各 
个 组 件 组 成 ， 并 使 用 了 组 件 集成 框架 ， 节 小 化 了 耦合 度 ， 并 且 由 于 有 了 定义 民 好 的 接口 为 基础 ， 
使 得 团队 之 间 可 以 相互 独立 地 进行 开发 。 开 发 团队 必须 严格 按照 接口 规 施 来 开发 组 件 。 

架构 团队 根据 以 往 的 经 验 进 行 设计 ， 并 使 用 了 关注 点 分 离 (separation of concerns) 的 原则 来 
应 对 性 能 和 资源 利用 方面 的 需求 。 例 如 ， 随 机 访问 内 存 (RAM) 被 分 为 了 数 个 逻辑 分 区 ， 分 别 
分 配给 了 系统 的 不 同 部 分 ， 再 用 给 予 优先 级 的 调度 程序 来 满足 性 能 的 需求 。 也 就 古 说 ， 整 体 的 设 
计 和 者 簿 了 广汉 认可 的 原则 和 习惯 。 

组 织 结构 方面 ， 这 个 项 目 涉 及 四 个 开发 站 点 ， 两 个 在 德国 ， 两 个 在 法 国 。 各 个 站 点 中 最 有 资 
历 的 代表 们 组 成 了 一 个 核心 架构 团队 , 每 个 站 点 都 将 负 贡 一 个 或 多 个 子 系统 的 设计 和 开发 。 项 目 
由 其 中 一 个 德国 开发 站 点 中 的 项 目 经 理 进行 管理 ,他 频 楷 地 在 各 个 站 点 之 同 军权。 每 个 站 点 的 工 
程 师 数量 都 差不多 。 

尽管 如 此 , Bass 等 人 还 是 曾 述 了 这 个 项 目 遇 到 的 很 多 严重 的 问题 , 我 将 集中 论述 其 中 的 两 个 。 
对 于 识别 技术 性 和 任务 性 依赖 关系 的 困难 程度 ， 这 两 个 回 题 可 以 作为 很 好 的 例子 。 

第 一 个 问题 是 ， 在 完成 了 第 一 个 版 本 的 时 候 ， 系 统 出 现 了 严重 的 性 能 问题 ,尤其 定 在 系统 局 
动 的 时 候 。 架 构 团 队 根据 以 往 的 经 验 ， 认 为 调度 程序 的 优先 级 规则 足以 让 各 个 团队 独立 工作 。 但 
是 , 他 们 没有 意识 到 这 些 规 则 需要 进行 大 量 的 调整 才能 适用 于 现在 这 个 项 目 。 要 解决 性 能 问题 就 
需要 大 量 额外 的 协调 工作 。 

第 二 个 问题 是 , 组 织 结构 妨碍 了 为 解决 性 能 问题 而 进行 的 协调 工作 。 染 构 团 队 将 组 件 及 子 系 
统 中 的 很 多 设计 决策 权 交 给 了 相关 的 站 点 , 而 各 站 点 所 做 的 决策 所 市 来 的 巨大 影响 一 直 等 到 开发 
后 期 才 被 发 现 。 在 发 现 了 依赖 关系 之 后 , 再 想 有 效 地 协调 就 变 得 困难 起 来 , 因为 团队 分 布 在 各 地 ， 
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而 且 相 互 之 间 对 于 所 做 的 工作 也 不 了 解 。 

这 个 例子 说 明 项 目的 技术 和 组 织 方面 并 不 是 相 互 独立 的 。 恰 恰 相 反 ， 他 们 互相 影响 。 在 接 下 
来 的 这 一 六 中 ， 我 将 论述 : 第 一 ， 各 种 类 型 的 技术 依赖 关系 ; 第 二 ， 如 采 不 能 识别 这 些 天 系 并 不 
能 协调 解决 的 话 , 会 对 生产 力 和 质量 造成 什么 影响 ; 第 三 , 识别 这 些 依赖 关系 的 传统 方法 。 然后 ， 
我 将 用 类 似 的 方式 概述 几 类 传统 的 工作 依赖 天 系 。 接 下 来 ， 我 将 探讨 依赖 关系 的 社会 -技术 二 重 
性 及 其 在 GSD 的 环境 下 对 效率 和 质量 的 影 啊 。 


20.2.1 技术 方面 


技术 类 依赖 关系 是 软件 系统 的 各 个 组 成 部 件 之 间 的 相互 关系 。 在 架构 或 者 细 太 设计 的 时 候 ， 
这 些 部 件 可 以 古 组 件 、 模 块 或 者 类 。 而 在 实现 的 过 程 中 ， 我 们 关注 的 部 件 则 是 源 代 码 文件 。 

软件 工程 师 们 通常 把 技术 类 依赖 关系 看 做 是 语法 (syntactic) 上 的 关系 。 也 就 是 说 ， 这 种 关 
系 的 具体 表现 就 是 程序 语言 的 元 素 ， 比 如 数据 结构 、 国 数 或 者 方法 调用 等 。 另 一 种 看 法 征 把 其 看 
做 软件 部 件 之 间 的 逻辑 或 者 语义 (semantic) 关系 。 比 如 ， 实 现 同 一 个 需求 的 两 个 组 件 在 逻辑 上 
契 相 关 的 。 

发 布 /订阅 系统 ”代表 着 另 一 种 逻辑 (或 语义 ) 关系 。 这 些 部 件 之 间 的 联系 不 是 直接 靠 “一 
个 模块 调用 男 一 个 模块 这 样 直 日 的 方式 体现 出 来 的 。 而 我 们 的 论述 主要 集中 在 语法 依赖 和 远 辑 
依赖 两 种 关系 之 间 的 区 别 ， 因 为 这 种 区 别 和 它们 的 识别 难度 密切 相关 。 

语法 依赖 关系 这 个 概念 产 目 编译 此 优 化 技术 , 其 主要 的 目的 是 理解 不 同 程序 语句 之 间 的 控制 
以 及 数据 流 关系 。 使 用 的 方法 通常 是 从 源 代码 或 者 茶 种 代码 的 中 生 表 示 法 (比如 字 市 码 或 者 抽象 
语法 树 ) 中 提取 关联 信息 。 然 后 再 分 析 各 种 语法 单位 ， 比 如 语句 、 函 数 或 者 方法 ,以 找 出 数据 相 
Fe (如 某 个 数据 结构 由 函数 A 修改 然后 又 被 函数 B 使 用 了 ) 或 者 功能 相关 (如 方法 A 调用 了 方法 B) 
的 依赖 关系。 

这 种 基于 语法 的 依赖 关系 的 分 析 方 法 用 处 很 多 , 从 用 于 检测 缺陷 的 静态 分 析 到 帮助 开发 人 员 
理解 和 调试 代码 的 工具 , 部 有 使 用 , PEIE, 这 种 类 型 的 关联 信息 有 一 些 问 题 。 在 菜 些 情况 下 ， 
这 些 信息 会 不 准确 。 例 如 ， 在 诸如 C 或 者 C++ 一 类 的 编程 语言 中 ， 函 数 指针 和 条 件 性 编译 指令 常 
常会 给 基于 源 代码 的 语法 分 析 带 来 很 多 困难 。 在 面向 对 象 的 语言 中 ， 由 于 有 多 态 性 
(polymorphism) 的 存在 ， 使 我 们 几乎 不 可 能 在 实际 运行 之 前 就 弄 明白 两 个 类 之 间 的 关系 。 在 另 
一 些 情况 下 ,语法 依赖 关系 信息 又 过 于 富余 了 , 查 出 来 的 源 代码 文件 之 间 的 关系 简直 是 千 丝 万 缕 ， 
使 分 析 的 过 程 变 得 困难 重重 。 

另外 一 个 分 析 源 代码 文件 中 的 技术 类 依赖 关系 的 方法 , 是 分 析 在 同一 个 开发 动作 (如 开发 某 
个 新 功能 或 者 修复 茶 个 缺陷 ) 之 内 同期 修改 的 源 代 码 文件 的 集合 。Gall 等 人 指出 ， 同 期 修改 的 文 
件 (比如 在 同一 次 版 本 控制 操作 提交 中 修改 的 文件 ) 之 间 有 着 某 种 依赖 关系 。 他 们 称 这 种 关系 为 
过 辑 依赖 关系 。 很 显然 ,逻辑 依赖 关系 和 语法 依赖 关系 并 非 完全 不 同 的 两 种 关系 。 事 实 上 ， 罗 
辑 依 赖 关 系 不 但 包括 了 语法 上 的 关系 〈 比 如 某 次 提交 和 是 因 为 修改 了 某 个 国 数 的 参数 ,这 个 国 数 由 
文件 A 中 实现 并 在 文件 B 中 调用 )， 还 可 能 包括 更 复杂 的 语义 上 的 依赖 关系， 比如 茶 一 个 文件 中 所 
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进行 的 运算 会 影 啊 男 一 个 文件 所 实现 的 行为 。 

这 种 技术 性 依赖 关系 的 分 析 方 法 有 一 大 优点 ， 那 就 古 比 起 调用 关系 图 (call graph) 或 者 其 他 
RIR, 它 可 以 使 我 们 更 好 地 合计 语义 上 的 依赖 关系 ,因为 它 不 徘 语言 结构 来 确定 源 代 码 文 件 之 间 
的 依赖 关系 。 比 如 ， 对 于 远程 过 程 调用 (RPC) 来 说 ， 基 于 语法 的 分 析 虽 然 可 以 提供 足够 的 信息 
来 把 两 个 模块 联系 起 来 ， 但 是 ， 这 样 的 信息 可 能 深 蕊 于 从 RPC 调 用 者 到 RPC 占 位 方法 (stub) 再 
到 RPC 服 务 如 模块 的 漫长 路 径 之 中 。 而 用 男 一 种 方法 分 析 就 人 简 单 多 了 :调用 RPC 的 模块 和 实现 RPC 
服务 如 的 模块 实际 上 古 同 时 被 修改 的 , 这 样 束 建 并 了 一 个 逻辑 依赖 关系 ， 即 被 影响 的 源 代 码 文 件 
之 间 的 直接 依赖 关系 。 

这 种 分 析 方 法 可 以 使 我 们 更 好 地 分 析 发 布 者 /订阅 者 系统 以 及 基于 事件 的 系统 。 在 这 些 系统 
中 ,调用 关系 图 无 法 将 相互 独立 的 模块 联系 起 来 , 因为 从 语法 上 来 看 它们 并 没有 任何 可 见 的 关联 。 
比如 触发 某 个 事件 的 模块 和 处 理 该 事件 的 模块 ， 它们 之 间 就 没有 可 见 的 语法 关联 。 此 时 ,这 种 分 
析 方 法 就 可 以 派 上 用 场 ， 用 来 分 析 系 统 中 重要 但 是 又 不 可 见 的 依赖 关系 。 

还 有 一 扩 很 重要 ， 那 就 是 这 种 方法 可 以 过 滤 挥 开发 人 员 不 需要 的 语法 关联 。 比 如 , 语法 分 析 
会 凸显 各 种 基本 的 库 之 间 的 联系 (如 内 存 管理 、 打 印 功 能 )， 因 为 这 些 库 包 仿 了 高 度 而 合 的 文件 。 
然而 这 些 库 虽然 有 着 很 高 的 耦合 度 ， 但 通 稼 也 稳定 并 且 不 容易 出 错 。 

需要 注意 的 定 ， 用 逻辑 分 析 法 来 分 析 技 术 性 依赖 关系 也 有 它 的 问题 。 主 要 的 问题 征 这 些 依赖 
关系 是 从 历史 数据 (比如 版 本 控制 系统 ) 中 提取 的 。 如 末 没 有 这 样 的 资源 ， 就 无 法 有 效 地 确定 源 
代码 文件 之 间 的 逻辑 依赖 关系 。 

虽然 两 种 方法 都 有 其 局 限 性 , 但 语法 分 析 法 和 远 辑 分 析 法 都 能 提供 有 效 的 补充 信息 ,并 从 多 
个 层面 帮助 识别 和 管理 软件 开发 项 目 之 中 的 依赖 关系 。 下面 这 一 市 我 们 将 讨论 两 种 类 型 的 依赖 关 
系 对 于 软件 开发 项 目的 生产 力 及 质量 的 影响 。 

1. 语法 依赖 关系 及 其 对 生产 力 和 质量 的 影响 

语法 依赖 关系 是 一 种 简单 的 工具 ,， 它 可 以 帮助 你 了 解 传统 的 软件 工程 概念 〈 比 如 耦合 度 和 凝 
聚 度 ) ， 以 及 这 些 概 念 会 如 何 影响 软件 开发 的 质量 和 效率 。 不 过 ， 在 对 耦合 度 和 凝聚 度 如 何 影 啊 
软件 开发 的 研究 中 ,大 部 分 古 关 于 二 者 对 质量 的 影 啊 , 而 关于 二 者 对 于 开发 效率 的 影 啊 的 研究 则 
相对 较 少 。 

Banker 等 人 就 发 现 ， 一 个 软件 组 件 的 语法 依赖 关系 越 多 ， 与 其 相关 的 维护 成 本 就 越 高 ，。 维 
护 成 本 的 升 高 主要 起因 为 没有 意识 到 随 着 语法 关系 的 增加 ， 复 杂 度 也 会 升 高 。 

在 20 世 纪 70 年 代 中 期 ,， 当 耦合 度 和 凝聚 度 的 概念 产生 之 后 , 研究 人 员 们 花费 了 大 量 的 心思 来 研 
究 这 些 概念 之 间 的 关系 及 其 对 于 软件 质量 的 影响 。 这 一 系列 的 工作 造就 了 大 批 的 度量 法 ,从 最 简单 
的 量化 语法 依赖 关系 (如 数据 类 型 的 引用 次 数 或 者 某 个 源 代码 文件 中 函数 调用 次 数 ) 的 方法 , 到 复 
杂 的 尝试 捕捉 看 合 的 各 种 结构 特征 (如 继承 树 的 深度 ) 的 方法 。 部 分 度量 法 已 在 第 8 草 中 讨论 过 。 

如 朱 用 一 句 话 来 非常 简单 地 总 结 这 些 研 究 的 结论 , 那 就 是 ， 软件 实体 〈 如 文件 、 组件、 模块 ) 
中 的 语法 关联 越 多 ， 其 缺陷 就 越 多 。” 不 过 ,语法 关联 和 软件 质量 的 关系 还 不 只 是 那么 简单 。 最 近 
的 一 份 研究 “指出 ， 数 据 相关 的 依赖 关系 (如 数据 类 型 的 使 用 ) 比 起 功能 相关 的 依赖 关系 (Ank 
数 A 调 用 函数 B) 更 容易 引起 软件 缺陷 。 对 于 这 种 区 别 , 一 个 可 能 的 解释 是 : 比 起 功能 之 间 的 关联 ， 
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要 了 解数 据 之 间 的 关联 需要 更 多 抽象 思维 ， 这 样 才能 知道 数据 会 如 何 随 着 程序 的 执行 而 改变 。 

语法 依赖 关系 的 结构 也 很 重要 。 比 如 ，Zimmermann 和 Nagappan 使 用 了 图 理论 的 方法 来 计算 
从 Windows 二 进 制 文件 中 提取 出 来 的 语法 依赖 关系 网 络 ， 并 发 现 ， 将 这 种 关系 网 络 和 传统 的 测量 
法 (如 代码 改动 ) 相 结合 使 用 ， 可 以 有 效 地 预测 发 布 后 可 能 产生 的 软件 缺陷 -“。 

2. 逻辑 依赖 关系 及 其 对 生产 力 和 质量 的 影响 

逻辑 依赖 关系 这 个 概念 比 技术 依赖 关系 要 新 得 多 , 这 也 就 很 不 幸 地 意味 着 : 关于 它 对 软件 项 
目的 质量 和 生产 力 的 影响 ,我 们 的 了 解 要 少 得 多 。 早 期 的 研究 结果 表明 ,逻辑 和 技术 两 类 依赖 关 
系 对 于 质量 的 影响 是 相似 的 。 但 是 ， 近 期 的 研究 找到 了 一 些 更 有 趣 的 结果 。 

我 和 我 的 同事 “研究 了 截然 不 同 的 两 个 公司 的 两 个 大 型 系统 ,并 发 现 : 在 预测 故障 这 件 事 上 ， 
逻辑 依赖 关系 比 技术 依赖 关系 有 效 得 多 。 事 实 上 ， 只 要 我 们 考虑 逻辑 依赖 关系 ， 语 法 依赖 关系 的 
影响 就 可 以 忽略 不 计 了 。 这 些 研究 结果 对 于 开发 人 员 来 说 有 着 重要 的 意义 ， 因 为 它们 表明 ， 要 想 
识别 和 理解 依赖 关系 ， 就 不 能 把 重心 放 在 明显 而 直 白 的 语法 依赖 关系 上 ， 而 得 去 关注 那些 不 那么 
明显 的 关联 。 

其 次 , 这 些 结果 还 表明 , 逻辑 依赖 关系 也 会 影响 质量 。 比 如 , 在 对 那 两 个 大 型 系统 的 研究 中 |， 
我 们 发 现 ， 对 于 那些 和 某 个 源 代码 文件 (例如 A 文件 ) 有 逻辑 依赖 关系 的 文件 来 说 ， 它 们 之 间 的 
逻辑 依赖 关系 越 紧 密 ， 文 件 A 相 关 故 障 的 发 生 率 就 越 低 。 这 样 的 结果 表明 ， 开 发 人 员 应 该 更 好 地 
认识 逻辑 依赖 关系 ， 比如 一 组 文件 之 间 的 联系 有 多 紧密 ， 如 何 才 能 保证 对 系统 的 某 个 部 分 的 修改 
不 会 使 其 他 部 分 产生 问题 等 。 更 有 价值 的 是 , 我 们 发 现 逻 辑 依 赖 关系 的 结构 比 语法 依赖 关系 的 结 
构 更 重要 。 比 如 ， 我 和 同事 Nambiar 一 起 研究 了 一 个 大 型 跨国 的 开发 组 织 ， 并 证 明了 构件 之 间 的 
逻辑 依赖 关系 的 密度 是 影响 GSD 项 目 质量 产 出 更 为 重要 的 因素 之 一 , 但 是 对 于 语法 依赖 关系 则 没 
有 此 类 证 据 '"。 


20.2.2 ”社会 /组 织 结构 方面 


软件 开发 中 的 依赖 关系 还 有 其 社会 性 的 一 面 ， 即 完成 开发 任务 所 必要 的 沟通 、 信 息 共享 和 协 
调 需求 。 我 们 将 这 些 依赖 关系 称 之 为 工作 依赖 关系 。 对 于 那些 参加 过 软件 开发 项 目 (尤其 是 大 型 
开发 项 目 ) 的 人 来 说 ， 较 为 明显 的 一 点 ， 束 是 项 目 成 员 要 想 有 效 地 识别 和 管理 所 有 这 些 工 作 依 赖 
关系 有 很 多 障碍 ， 比 如 不 同 的 经 验 、 组 织 结构 、 地 理 位 置 ， 以 及 时 间 安 排 上 的 压力 等 。 

比如 ,， 当 开发 人 员 对 于 系统 的 经 验 有 限 的 时 候 , 他 们 常 弟 难 以 理解 他 们 在 任务 中 所 做 的 修改 
(比如 确保 满足 茶 个 方法 的 调用 前 及 调用 后 条 件 ) 对 于 整个 系统 有 什么 六 在 的 影响 。 这 些 认 知 差 
距 的 结果 ， 就 是 更 低 的 效率 (比如 需要 返工 ) 或 者 更 差 的 质量 。 

然而 ，“ 经验” 并 不 单纯 指 对 于 技术 或 者 系统 的 了 解 。 熟 悉 与 团队 成 员 的 合作 会 大 大 改善 生 
广 力 和 质量 ,因为 对 于 同事 的 了 解 会 促进 信息 的 共享 以 及 协调 工作 。 比 如 ,工程师 之 间 第 常会 发 
展 出 一 套 相 互 协调 的 方法 , 慢 慢 地 相互 之 间 都 能 知道 在 什么 时 候 用 什么 方式 来 癌 对 方 癌 问题 或 者 
共享 信忠。 

关于 管理 和 识别 工作 依赖 关系 ， 有 一 个 重要 却 又 时 第 被 忽略 的 因素 是 项 目 及 开发 组 织 的 结 
构 。 这 样 的 结构 横 跨 了 多 个 元 素 ， 比 如 参与 项 目的 一 系列 单位 〈 即 团队 、 部 门 等 )、 它 们 之 间 的 
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正式 汇报 路 线 ( 即 汇报 的 上 下 级 关系 )、 它 们 的 行政 和 开发 流程 其 至 它们 的 员工 激励 机 制 。 所 有 
这 些 元 素 共 同 发 挥 作用 ， 使 项 目 成 员 们 形成 了 一 套 互 动 、 协 调和 合作 的 方法 。 

将 软件 项 目的 开发 分 布 到 多 个 地 点 不 利于 信息 的 共享 和 集成 。 比 如 , 我们 都 知道 开发 人 员 们 
前 稍 会 共享 一 些 和 他 们 当前 任务 相关 的 技术 信息 ， 而 这 种 共享 的 场所 通 前 是 在 走廊 或 者 咖啡 机 
旁 ， 而 共享 的 方式 是 简短 而 休闲 的 对 话 。 当 开发 人 员 们 处 于 不 同 的 地 点 时 ， 这 样 即兴 的 沟通 就 不 
可 能 了 。 相 反 , 项 目 成 员 们 很 难 一 直 注 意 其 他 人 正在 进行 的 任务 、 做 的 决定 和 如 到 的 困难 。 最 后 
的 结果 就 是 协调 失当 、 信 息 整 合 出 问题 ， 最 终 导 致 生产 力 和 质量 的 下 降 “”。 

然而 ， 分 散在 多 个 地 氮 除了 无 法 进行 即兴 的 沟通 之 外 , 还 有 其 他 的 问题 。 大 幅度 的 时 区 差异 
(超过 6 小 时 ) 会 显赫 降低 用 同步 交互 (如 电话 或 者 视频 会 议 ) 来 实时 解决 问题 的 可 能 性 。 在 这 种 
情况 下 ， 项 目 成 员 第 第 会 选择 异步 交流 ， 比 如 电子 邮件 。 可 惜 的 是 ，Espinosa 等 人 已 经 证 明 ， 由 
于 异步 交流 的 信息 流向 管理 相当 繁杂 ， 使 用 这 种 方式 往往 会 造成 大 量 的 误解 和 错误 "。 

此 外 ,分散 开 发 还 有 一 个 问题 ,， 那 就 是 项 目 组 成 员 不 太 可 能 相互 认识 。 通 第 我 们 对 在 同一 个 
办 公 地 点 并 熟悉 到 一 定 程 度 的 同事 会 共享 更 多 的 信息 , 而 对 于 其 他 办 公 室 或 者 其 他 地 点 的 同事 则 
少 一 些 。 在 这 种 情况 下 ， 当 同事 们 互 不 相识 时 ,对 于 共 侍 信息 请 求 的 回复 可 能 束 会 不 及 时 其 至 被 
完全 名 上 略 掉 了。 而 结 来 就 是 项 目 组 的 成 员 第 第 难以 识别 相关 的 工作 依赖 关系 ,特别 古 当 发 生意 外 
的 要 化 时 。 

最 后 , 软件 项 目 在 时 间 安 排 上 的 压力 会 对 项 目 成 员 识 别 和 管理 工作 依赖 关系 的 能 力 产 生 重 大 
的 影响 。 通 稍 来 说 ， 时 间 安 排 压 力 越 大 ， 并 行 〈 而 且 可 能 是 相互 依赖 ) 的 开发 任务 就 会 越 多 。 想 
象 一 下 ， 基 个 功能 B 本 来 是 要 在 功能 A 之 后 开发 的 ，B 依 赖 A。 由 于 时 间 上 的 压力 ， 两 个 功能 必须 
同时 进行 开发 。 为 了 做 到 这 一 点 ， 开 发 人 员 需 要 面 对 新 的 、 更 加 复杂 的 协调 需求 。 

比如 ， 两 个 功能 之 间 的 接口 可 能 会 随 着 开发 的 进行 而 发 展 , 这 就 需要 不 断 地 进行 协调 以 避免 
集成 问题 和 难以 发 现 的 缺陷 。 此 外 ， 开 发 人 员 可 能 还 需要 使 用 特别 的 “ 粘 合 代 码 ”(glue code) 
来 逐步 测试 正在 开发 的 代码 。 换 句 话 说 ， 要 想 圆满 完成 这 些 任 务 ， 就 需要 一 套 适 当 的 协调 机 制 ， 
这 套 机 制 必须 能 够 让 开发 人 员 识 别 相关 的 依赖 关系 并 对 这 些 关 系 进行 妥善 的 处 理 。 

下 面 一 市 我 们 将 讨论 各 种 类 型 的 工作 依赖 关系 以 及 他 们 对 于 生产 力 和 质量 的 影响 。 

不 同 的 工作 依赖 天 系 及 其 对 生产 力 和 质量 的 影响 

最 前 见 的 看 待 工作 依赖 关系 的 方式 是 模 拟 任 务 之 同 的 关系 。 这 些 依赖 关系 主要 集中 在 任务 的 
时 间 优 先 级 上 《如 任务 A 必 须 在 任务 B 之 前 完成 )。 使 用 这 种 思维 方式 的 项 目 采 用 了 大 量 的 工具 来 
识别 和 管理 这 些 依 赖 关 系 ， 从 分 析 性 和 图 表 化 的 方法 (如 甘 特 图 和 PERT 图 ) 到 各 种 支持 这 种 工 
作 流 程 的 工具 。 

我 们 也 许 都 会 知道 : 如 末 我 们 不 能 认识 到 这 些 依赖 关系 并 对 其 做 有 效 的 管理 , 开发 时 间 就 会 
被 拖 长 。 但 是 ， 其 实 我 们 还 可 以 对 这 类 的 信息 做 更 有 趣 的 分 析 。 我 和 我 的 同事 “参考 了 在 同一 
个 发 行 版 本 中 各 个 开发 任务 的 时 间 依 赖 关系 , 并 使 用 了 一 种 社会 网 络 分 析 法 来 分 析 工 作 流 程 依赖 
关系 图 ,图 中 的 点 表示 开发 组 织 成 员 , 边 则 代表 开发 任务 在 开发 人 员 之 间 的 交接 。 然 后 我 们 将 
使 用 社会 网 络 分 析 法 来 分 析 这 类 人 与 人 之 间 的 关系 。 我 们 发 现 ,， 这 些 天 系 中 有 很 多 都 需要 双方 付 
出 大 量 的 精力 来 维护 。 
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这 一 扩 在 工作 流程 的 依赖 关系 中 非 第 重要 ,因为 它 表 明 , 处 于 项 目 核心 位 置 的 成 员 有 更 多 额 
外 的 消耗 而 这 些 消 耗 使 他 们 更 容易 不 堪 人 负 笨 ,增加 了 沟通 不 畅 的 可 能 性 , 也 使 得 软件 面临 质量 降 
低 的 风险 。 实 际 上 ， 我 们 的 结论 正好 支持 这 一 论点 。 结 论 显示 ， 当 (被) 依赖 度 很 高 的 人 修改 一 
个 源 代码 文件 时 ， 这 个 文件 更 容易 出 回 题 。 

时 间 (或 者 说 流程 ) 类 依赖 关系 有 一 个 变 体 ， 即 不 关注 于 任务 的 完成 或 者 交接 ， 而 关注 于 信 
AND. BARH, 假设 我 们 有 两 个 相互 依赖 的 任务 : 开发 模块 A 和 开发 模块 B， 模块 B 会 调用 
模块 A 的 功能 。 在 这 种 情况 下 ,这 两 个 任务 的 时 间 依 赖 关系 就 存在 于 “如 何 实现 B 对 A 的 调用 "这 
个 信息 之 中 了 。 有 了 这 个 信息 ， 开 发 模块 A 的 开发 人 员 可 以 定义 一 个 接口 ， 并 提供 这 个 信息 给 模 
块 B 的 开 必 人员。 然后 ， 这 两 个 任务 可 以 同时 进行 。 

并 行 工 程 学 (concurrent engineering) 的 研究 主要 关注 相互 依赖 的 并 行 任务 的 管理 方法 ， 这 
KMR: 如 采 我 们 可 以 提前 确定 信息 需求 ,就 可 以 使 用 适当 的 协调 机 制 来 处 理 相互 重 登 的 开 
发 任务 之 间 的 信息 类 依赖 关系 。 可 惜 的 是 ,常见 的 软件 开发 项 目的 实际 情况 却 并 非 如 此 简单 。 在 
项 目的 整个 生命 周期 中 ， 惫 会 有 儿 十 个 其 至 数 百 个 任务 会 产生 重合 。 在 很 多 情况 下 ,我 们 在 进行 
任务 之 前 并 不 能 完全 和 敬 握 这 些 任务 的 时 间 优 先 级 以 及 任务 之 则 的 信息 类 依赖 关系 。 EKE, HF 
需求 会 逐 壮 确定 下 来 ,而 开发 人 员 对 需求 的 理解 也 逐 湖 加 深 , 任务 之 间 的 依赖 关系 也 可 能 会 产生 
{Ce 

我 最 近 做 的 一 次 研究 ”分 析 了 某 大 型 跨国 软件 公司 的 209 个 分 布 式 开发 项 目 ， 并 发 现 开 发 任 
务 之 间 的 重 登 程度 越 高 《根据 任务 追踪 系统 的 记录 ) ， 这 个 软件 的 质量 就 越 低 。 更 重要 的 是 ， 在 
软件 生命 周期 的 任何 阶段 ,任务 的 重 登 所 产生 的 影响 都 是 一 致 的 。 也 就 是 说 ， 任 务 的 重 登 不 只 是 
在 项 目 里 程 碑 快要 到 达 (通常 此 时 并 行 的 开发 工作 猛 增 ) 的 时 候 才 对 质量 有 影响 。 它 在 任何 时 候 
部 会 影 啊 质量 。 这 些 结 来 是 很 有 意义 的 ， 因 为 它们 展示 了 追踪 这 些 依赖 关系 的 重要 性 ， 所 以 省 理 
者 和 其 他 相关 人 士 可 以 采取 行动 来 解决 这 些 不 恨 影响 。 

第 三 种 工作 依赖 关系 来 源 于 组 织 , 作为 一 个 特定 的 角色 , 能 否 建立 有 效 沟 通 和 协调 途径 来 满 
足 共 享 信息 的 需求 。Nagappan 等 人 使 用 传统 的 组 织 结构 图 所 提供 的 信息 构建 了 一 系列 的 指标 , 并 
研究 了 在 Windows 组 件 和 程序 中 ,这 些 指标 和 故障 的 关系 ~。 虽 然 他 们 的 方法 并 没有 专门 包含 工 
作 依 赖 关系 ， 但 却 代 表 了 众多 的 组 织 现 象 的 指标 代理)， 包 括 工作 依赖 关系 的 相关 问题 。 他 们 
的 分 析 结 东非 常 有趣。 

比如 ， 参 与 开发 某 个 组 件 〈 或 二 进 制 文件 ) 的 部 门 越 多 ， 其 质量 就 越 低 。 此 外 ， 开 发 或 修改 
组 件 的 人 员 的 组 织 层 级 差别 也 会 对 软件 质量 有 负面 影响 。 这 些 结 有 末 强 调 了 跨 组 织 〈 如 跨 团 队 、 部 
门 、 地 点 等 ) 的 沟通 和 协调 所 面临 的 困难 ， 以 及 这 些 困难 可 能 对 软件 质量 造成 的 不 展 影响 。 

软件 系统 的 开发 包括 一 系列 的 设计 决策 , 有 的 在 架构 层面 ， 有 的 在 实现 层面 。 这 些 设计 决策 
有 可 能 市 来 一 些 限制 ,而 这 些 限 制 有 可 能 在 系统 各 部 分 之 间 建 立新 的 依赖 关系 , 也 有 可 能 变更 其 
至 消除 既 有 的 关系 。 依 赖 关 系 的 变更 又 可 能 市 来 新 的 协调 需求 ， 而 这 类 需求 又 很 难 预 完 确定 。 

比如 ， 有 个 任务 需要 修改 杂 组 件 中 的 RPC 的 内 存 分 配 策 略 以 改善 性 能 。 这 样 的 修改 可 能 会 影 
啊 这 个 组 件 和 其 他 组 件 之 则 的 RPC 交 互 的 时 机 ， 从 而 使 这 些 RPC 的 用 户 所 做 的 茶 些 条 件 判断 失 
效 。 为 了 更 好 地 了 解 如 何 捕 捉 这 种 动态 的 依赖 关系 ， 我 和 我 的 同事 ”提出 了 一 套 社会 -技术 杠 
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架 ， 用 于 分 析 软 件 的 逻辑 依赖 关系 和 开发 工作 的 结构 之 间 的 联系 。 

协调 需求 ”是 这 个 框架 中 的 一 个 衡量 标准 ， 这 个 标准 衡量 的 是 ， 在 已 知 各 个 开发 任务 所 影 
啊 的 系统 部 件 以 及 它们 之 间 的 技术 依赖 关系 的 情况 下 , 各 个 成 员 的 工作 在 多 大 程度 上 依赖 于 其 他 
成 员 的 工作 。 关 于 这 个 标准 的 一 个 重要 发 现 ,， 征 开发 人 员 所 需要 面 对 的 协调 需求 越 高 ， 其 所 修改 
的 源 代码 文件 的 质量 束 越 低 。 换 句 话 说 , 随 看 开发 的 进行 ， 从 系统 的 逻辑 依赖 天 系 所 往生 出 来 的 
协调 需求 越 来 越 多 ， 开 发 人 员 也 束 越 来 越 容 多 5| 入 bug。 


20.2.3 ”社会 -技术 方面 











软件 开发 ， 或 者 更 普 遇 一 扣 ， 所 有 的 产品 开发 都 包含 技术 和 社会 /组 织 这 两 个 元 素 。 到 目前 
为 止 ， 我 们 讨论 了 在 单独 一 个 方面 内 的 依赖 天 系 。 但 是 ， 技 术 和 社会 /组 织 这 两 个 方面 实际 上 古 


相互 交织 的 ， 孤 立地 去 考虑 某 一 方 就 无 法 看 到 项 目的 全 貌 。 

从 社会 -技术 角度 来 看 软件 开发 中 的 依赖 关系 其 实 非常 简单 。 当 任务 之 间 产 生 协调 需求 和 开 
发 人 员 的 实际 协调 工作 相符 合 的 时 候 ， 开 发 效率 和 软件 质量 束 会 提升 。 然 而 ， 社 会 -技术 视角 真 
正 的 重要 作用 在 于 它 可 以 识别 和 追踪 社会 和 技术 类 依赖 关系 之 间 的 动态 联系 , 对 不 同 的 技术 依赖 
关系 【如 语法 或 逻辑 依赖 关系 ) 进行 精细 分 析 ， 并 调查 软件 开发 中 由 技术 依赖 关系 所 产生 的 协调 
需求 。 

比如 ， 我 和 我 的 同事 使 用 来 自 两 个 大 型 软件 项 目的 多 个 软件 储存 库 (如 版 本 控制 系 
St. WER ASL) 中 的 数据 来 展示 : 当 工 程 师 识别 并 处 理 了 相关 的 协调 需求 的 时 候 ， 软 件 的 
质量 和 开发 效率 都 会 有 所 提升 。 这 项 研究 的 男 一 个 重要 结论 是 : 工作 相关 的 协调 需求 ， 实 际 上 甸 
党 古 从 逻辑 依赖 关系 而 不 古语 法 依赖 关系 中 来 的 。 浆 辑 依赖 关系 通常 会 捕捉 到 语义 上 的 、 更 为 隐 
性 的 联系 ， 而 不 古 像 语 法 关系 那样 直 白 的 联系 工程师 们 可 以 直接 靠 看 代码 来 识别 这 些 联 系 )。 

比如 ， 逆 辑 依 赖 关 系 可 以 表示 两 个 系统 组 件 之 间 的 发 布 者 介 ] 阅 者 关系 或 者 时 序 关 系 。 在 这 
种 情况 下 ， 语 法 结构 第 第 无 法 提供 足够 的 信息 来 帮助 我 们 识别 这 种 依赖 关系 。 

在 我 们 对 能 够 决定 工作 依赖 关系 的 那 部 分 软件 依赖 关系 进行 调查 的 时 候 , 还 发 现 了 一 个 相关 
的 结论 ， 那 就 是 协调 工作 没有 对 应 到 相应 的 依赖 关系 是 影响 开发 效率 和 软件 质量 的 主要 因素 。 

结合 芬 虑 技术 和 社会 /组 织 两 个 方面 也 让 我 们 可 以 更 好 地 认识 如 何 才能 改善 跨 多 组 织 的 大 型 
软件 开发 项 目 。 人 举例 来 说 ， 我 在 对 一 个 大 型 公司 的 209 个 项 目的 研究 中 曾 总 结 ， 跨 项 目的 构架 依 
赖 关系 常常 带 来 较 低 的 软件 质量 `。 这 样 的 结果 表明 ， 超 越 传统 组 织 结构 〈 如 团队 ) 的 协调 和 意 
识 以 及 在 更 大 沁 围 的 开发 组 织 内 部 提供 支持 是 非常 重要 的 。 

此 外 ， 我 还 和 Nambiar 探 讨 了 在 多 地 分 布 式 开发 的 软件 项 目 中 ， 技 术 上 的 耦合 性 是 如 何 影响 
质量 的 问题 “。 我 们 的 主要 发 现 是 ， 在 项 目 外 部 的 技术 依赖 〈 比 如 组 件 A 和 B 相 接 ， 但 是 组 件 B 
在 此 项 目 之 外 被 修改 ) 越 多 , 软件 质量 就 越 低 。 跨 项 目的 逻辑 依赖 关系 使 得 预计 的 缺陷 数量 上 升 
了 50%， 这 个 影响 的 大 小 和 某 些 传统 的 因素 类 似 ， 如 产 出 的 代码 数量 或 者 能 力 成 熟 度 模型 的 流 
程 成 熟 度 。 


























@ Capability Maturity Model， 用 于 分 析 开 发 流程 并 进行 改进 的 模型 。 一 一 译 者 注 
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20.3 ”从 研究 到 实践 


在 前 一 方 中 我 们 讨论 了 在 过 去 差不多 十 年 里 所 学 到 的 关于 在 GSD 环 境 下 处 理 依 赖 关系 的 经 
难 。 我 们 现在 将 分 析 这 些 研究 成 末 的 实际 意义 。 


20.3.1 充分 使 用 软件 储存 库 中 的 数 气 


在 调查 依赖 关系 如 何 导 致 协调 问题 ,进而 导致 生产 力 和 质量 降低 的 研究 中 ， 有 很 大 一 部 分 从 
软件 储存 库 中 收集 到 的 数据 。 这 种 储存 库 的 例子 有 版 本 控制 系统 、 缺 陷 和 任务 追踪 系统 、 各 类 产 
品 维基 ， 当 然 还 有 源 代 码 本 导 。 肝 无 疑问 ， 这 类 研究 强调 创建 及 维护 软件 储存 库 可 能 带 来 的 巨大 
价值 ， 因 为 它 可 以 帮助 我 们 评估 影响 软件 开发 项 目的 各 种 因素 。 那 么 ， 既然 这 类 储存 库 在 现今 的 
软件 开发 组 织 中 已 经 非常 普 咒 了 , 我 们 何不 使 用 库 中 的 丰富 数据 来 改善 软件 开发 工作 呢 ” 抱 着 这 
个 想法 ， 本 证 将 讨论 几 个 使 用 案例 。 

软件 开发 组 织 中 ， 最 简单 而 又 最 有 用 的 做 法 ， 可 能 就 是 将 版 本 控制 系统 和 人 缺陷 /任务 追踪 系 
统 中 的 数据 连接 起 来 了 。 如 果 这 样 做 , 我们 就 将 得 到 开发 任务 和 缺陷 之 间 的 明显 联系 ， 并 能 从 版 
本 控制 系统 中 找到 相应 的 源 代码 (或 者 其 他 部 件 ) 修改 。 在 这 本 书 中 ， 第 9 章 和 第 25 章 都 研究 了 
这 个 问题 。 

显然 , 这 种 储存 库 之 间 的 联系 可 以 让 我 们 识别 一 些 软件 流程 中 可 追 踊 的 基本 联系 。 最 重要 的 
是 ， 它 使 我 们 可 以 应 用 一 系列 的 分 析 法 和 工具 来 大 幅 改 善 开 发 组 织 有 效 协调 的 能 力 ， 尤 其 是 在 
GDS 环 境 下 的 协调 能 力 。 比 如 说 ， 我 和 我 的 同事 "1" “设计 了 一 个 框架 ， 它 使 用 软件 储存 库 中 
的 信息 来 计算 出 各 种 指标 (如 技术 依赖 关系 、 改 动量 、 工 作 量 ) 以 及 找 出 协调 的 模式 (AEH ik 
陷 报 告 中 的 说 明 )。 这 份 研究 不 但 表明 我 们 可 以 评估 协调 上 的 失误 对 于 完成 任务 的 时 间 以 及 软件 
故障 的 影响 , 还 表明 我 们 可 以 只 基于 这 些 可 以 从 绝 大 多 数 软件 开发 项 目 中 找到 的 丰富 数据 来 进行 
可 乱 《〈 而 且 可 以 轻易 自动 化 ) 的 分 析 。Wagstrom 在 开源 软件 项 目 中 重复 了 同类 的 分 析 ， 进一步 地 
证 实 了 这 类 分 析 的 可 行 性 和 有 效 性 ”。 

软件 储存 库 已 成 为 了 支持 软件 开发 工作 (尤其 是 GDS 环 境 下 的 开发 工作 ) 的 众多 协作 工具 中 
的 核心 要 素 。 这些 协 作 工 具 借 助 传 统 的 基础 类 工具 (如 ClearQuest、 ClearCase, Subversion, Bugzilla 
和 oMantis 等 ) 来 提升 软件 开发 项 目的 沟通 和 协调 能 力 。 而 协作 工具 也 有 很 多 种 类 ， 包 括 : 

O 工作 区 感知 技术 (参见 参考 文献 [4]); 

O 专长 推荐 如 (参见 参考 文献 [25]); 

口 工件 推荐 系统 (参见 参考 文献 [15]); 

口 中 断 管理 系统 (参见 参考 文献 [18]); 

口 项 目 仪表 盘 及 可 视 化 状态 (参见 参考 文献 [31])。 

最 近 的 一 些 工 具 , 如 Tesserac“ 采 用 了 社会 -技术 的 视角 , 把 技术 和 工作 类 的 依赖 关系 用 可 视 
化 分 析 的 方法 结合 起 来 ， 以 方便 识别 和 管理 。 虽 然 这 些 工 具 中 的 很 多 都 是 在 研究 项 目 中 使 用 的 ， 
但 是 它们 中 不 少 功能 和 理念 都 已 经 商品 化 了 ， 比 如 IJBM 的 Rational Team Concert 和 微软 的 Visual 
Studio。 此 外 ， 还 有 一 些 开 源 的 实现 ， 特 别 是 作为 Eclipse 平台 的 插件 。 
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软件 储存 库 还 可 以 用 来 分 析 系 统 模 块 化 的 方式 是 否 有 问题 , 以 便 重组 或 者 重 构 代 码 。 一 旦 开 
发 人 员 、 软 件 架 构 师 或 者 其 他 相关 人 员 和 意识 到 技术 依赖 关系 存在 着 茶 种 规律 ,他们 就 可 以 使 用 专 
门 的 技术 来 减少 这 些 依 赖 关 系 (尤其 是 逻辑 关系 )。 例 如 ， 重 构 系 统 可 以 减少 逻辑 依赖 关系 ， 对 
软件 的 质量 会 有 积极 影 啊 。 

其 他 的 一 些 代码 重组 的 技术 ， 比 如 由 Mockus 和 Weiss… 提出 的 分 块 法 (chunking) ， 就 可 以 使 
用 各 种 类 型 的 技术 依赖 关系 , 使 系统 的 结构 更 适合 于 GSD 环 境 下 的 软件 开发 组 织 。 分 块 法 将 源 代 
码 文件 分 成 多 个 组 ,每 个 组 包含 多 个 (在 逻辑 上 和 语法 上 ) 联系 非常 紧密 的 源 代码 文件 ， 而 每 个 
组 和 系统 的 其 他 部 分 的 逻辑 关系 非常 少 。 相 同 的 方法 可 以 用 在 工作 依赖 关系 上 。 


20.3.2 团队 领导 和 管理 者 在 依赖 关系 管理 中 的 角色 


关于 依赖 关系 的 社会 -组 织 方面 及 社会 -技术 方面 的 研究 指出 , 团队 领导 和 管理 者 可 以 在 GSD 
项 目的 两 个 方面 发 挥 重要 作用 ,这 两 个 方面 是 组 织 障碍 和 工作 分 配 。 组 织 障碍 (如 部 门 、 场 所 以 
及 项 目 等 ) 常常 会 造成 很 多 困难 ， 使 得 相关 人 员 难 以 有 效 地 识别 和 管理 相关 的 依赖 关系 。 

对 待 组织 障 碍 的 传统 方式 是 建立 一 套 流程 , 这 套 流 程 提 供 各 种 基础 措施 来 管理 相互 依赖 的 团 
队 或 者 办 公 场 所 之 间 的 依赖 关系 。 但 是 ， 由 于 组 织 边界 (如 工作 地 点 ) 的 数量 越 来 越 多 ， 需 求 或 
者 功能 的 复杂 度 及 不 确定 性 也 越 来 越 高 , 流程 常常 不 能 满足 这 些 需 要 , 反而 开始 阻碍 开发 的 进展 。 
事实 上 ， 我 和 同事 Nambiar 已 经 证 明了 ， 软 件 开 发 越 分 散 ， 开 发 流程 对 于 质量 的 改善 就 越 少 ”。 
这 种 改善 的 减少 第 常 是 因为 流程 是 为 本 地 开发 (如 单个 场所 或 者 单个 部 门 ) 而 专门 设计 和 优化 的 ， 
这 就 导致 了 各 个 开发 场所 流程 之 间 的 不 一 致 。 

团队 领导 和 管理 者 可 以 帮助 大 家 解决 这 些 组 织 障碍 。 首 先 , 他 们 必须 意识 到 团队 领导 常常 只 
芳 虑 自己 职责 范围 内 的 事情 。 其 次 ， 他 们 必须 找 出 相互 依赖 的 工作 地 点 (或 者 其 他 组 织 单位 ) 都 
应 该 了 解 的 重要 人 员 以 及 重要 的 信息 流动 ， 以 促进 不 同 场 所 的 流程 之 间 的 统一 。 最后， 对 于 促进 
各 工作 地 点 之 间 的 信息 交换 ， 他 们 必须 保持 主动 而 开放 的 姿态 。 

Suzanne Weisband 对 于 管理 者 在 分 布 式 工作 环境 中 的 角色 已 经 进行 了 数 十 年 的 研究 中。 她 的 
主要 发 现 是 , 当 管 理 者 主动 地 收集 各 个 地 点 中 的 项 目 信 息 , 并 将 这 些 信息 共享 给 其 他 地 点 的 时 候 ， 
项 目的 效率 有 显著 的 提升 。 

工作 分 配 是 依赖 关系 管理 的 另 一 个 重点 ， 它 包括 两 个 重要 的 方面 : 工作 将 在 哪里 完成 及 工作 
将 于 何 时 完成 。 

在 将 任务 分 配 到 不 同 的 地 点 时 ,管理 者 们 的 主要 考虑 的 通常 是 能 力 和 成 本 。 但 是 不 能 忘记 社 
会 -组 织 因 素 的 重要 作用 ， 名 上 略 这 个 因素 对 于 生产 力 和 质量 造成 的 负面 影响 有 可 能 会 抵消 本 来 分 
布 式 开 发 所 能 节约 的 成 本 。 比 如 ， 在 最 近 做 的 一 些 研究 ”中 我 发 现 ， 那 些 开发 人 员 的 分 布 极 不 
均衡 的 项 目 〈 如 地 点 A 人 很 少 ， 地 点 B 人 巨 多 ) 常 帝 比 分 布 均匀 的 项 目 多 产生 40% 一 50% 的 缺陷 。 

此 外 , 项目 中 同时 进行 的 开发 任务 的 数量 越 多 ， 其 软件 产品 的 质量 就 越 差 。 实 际 上 ， 工 作 量 
在 整个 开发 周期 中 平均 分 布 的 软件 项 目 与 那些 偶尔 会 有 高 度 并 行 任务 的 项 目 相 比 , 前 者 的 缺陷 数 
量 只 占 后 者 的 一 半 。 与 此 形成 对 比 的 是 , 在 对 类 似 的 项 目 进 行 的 比较 中 我 们 发 现 ， 技 术 和 领域 相 
关 经 验 只 造成 了 软件 质量 中 20% 的 区 别 。 
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综合 这 些 结论 我 们 可 以 看 出 , 管理 者 在 分 配 任 务 的 时 候 还 需要 考虑 两 个 重要 因素 : 人 员 的 均 
衡 分 布 和 执行 任务 的 时 机 。 

总 而 言 之 ， 团 队 领 导 和 管理 者 的 帮助 可 以 让 依赖 关系 (尤其 是 分 布 式 项 目的 依赖 关系 ) 的 识 
别 和 管理 大 大 改观 。 


203.3 ”开发 人 员 、 工 作 项 目 和 分 布 式 开发 


软件 开发 人 员 总 是 罕 梭 在 技术 -工作 依赖 关系 的 复杂 了 网络 中 。 比 如 ， 他 们 人 花费 大 量 的 时 间 来 
了 解 代 码 的 不 同 部 分 之 同 如 何 互动 有 什么 关联 ， 以 及 对 于 代码 茶 个 部 分 的 改变 会 如 何 影响 其 他 
部 分 。 尽 管 他 们 花费 了 不 少 精 力 ， 但 前 稍 还 征 会 漏 掉 一 些 依赖 关系 。 

本 革 前 面 已 经 讨论 了 各 种 帮助 开发 人 员 更 好 地 识别 和 管理 依赖 关系 的 方法 。 第 一 个 方法 古 利 
用 交 辑 依赖 关系 。 首 先 ， 它 可 以 提供 语法 依赖 关系 之 外 的 重要 人 信息。 而且， 开发 人 员 还 可 以 菲 它 
来 更 好 地 了 解 不 同 产 代码 文件 和 模块 之 间 的 技术 关联 ， 以 及 茶 些 修改 可 能 造成 的 影响 。 当 然 ,使 
用 相关 工具 用 来 收集 逻辑 依赖 关系 信息 并 按照 适当 的 方式 来 癌 开 发 人 员 展 示 也 很 重要 。 不过, 传 
统 的 基础 工具 也 可 以 派 上 用 场 , 比如 我 们 可 以 从 版 本 控制 系统 中 找 出 哪些 文件 或 者 部 件 是 同时 修 
改 的 。 

第 二 个 方法 是 保持 对 其 他 组 件 或 者 模块 中 和 目 己 的 任务 有 重合 的 部 分 的 了 解 。 这 些 组 件 或 者 
模块 相关 的 设计 /实现 决策 或 者 修改 可 能 会 对 开发 人 员 的 贡 任 沙 围 户 生 重大 的 影响 。 开 发 人 员 往 
往 把 注意 力 (无 可 厚 非 地 ) 集中 在 他 们 直接 责任 沱 围 内 的 开发 任务 上 ， 例 如 一 个 组 件 、 部 件 、 模 
块 或 者 一 组 源 代 码 文件 。 要 想 对 其 他 开发 活动 保持 一 定 程度 的 了 解 ,， 有 一 个 毅 用 的 方法 是 在 缺陷 
跟踪 系统 中 订阅 茶 个 团队 〈 或 者 组 件 ) 的 任务 更 新 。 不 过 这 种 方法 很 快 就 不 够 用 了 ， 尤 其 是 在 大 
型 项 目 中 。 开 发 人 员 津 常会 被 滑 水 一 般 的 更 新 通知 邮件 淹没 , 慢 慢 地 也 就 不 再 注 革 它们 了。 将 依 
赖 关 系 分 门 别 类 将 有 助 于 开发 人 员 过 滤 复 杂 的 依赖 关系 网 络 , 并 对 相关 的 开发 任务 保持 足够 的 注 
io 

最 后 ， 在 相互 依赖 的 团队 (尤其 是 GSD 环 境 中 的 团队 ) 之 间 建 立 社交 往来 ， 也 是 一 个 有 效 地 
收集 和 分 享 相关 依赖 关系 的 重要 方法 。 在 几 十 年 中 所 进行 的 关于 交流 、 分 布 式 团队 和 社会 网 络 的 
研究 中 有 个 一 致 的 结论 , 那 就 是 相互 之 间 有 着 融洽 关系 的 人 们 常常 会 更 多 更 及 时 地 分 享 工作 相关 
的 信息 。 这 些 研 究 所 发 现 的 建立 社交 关系 的 方法 包括 : 在 非 工作 环境 中 面对面 的 互动 、 使 用 社会 
网 络 工 具 、 展 示 能 力 及 合作 态度 等 。 


20.4 未 来 的 方 加 
这 一 节 主 要 论述 可 能 对 识别 和 管理 软件 项 目 中 的 依赖 关系 产生 深远 影响 的 三 个 研究 方向 。 
20.4.1 适合 GSD 的 软件 架构 


依赖 关系 的 社会 -技术 视角 强调 了 尽早 识别 相关 依赖 关系 的 好 处 ， 在 识别 了 依赖 关系 之 后 ， 
项 目 组 即 可 采取 适当 的 协调 措施 。 软 件 架构 已 经 成 为 开发 流程 不 可 或 缺 的 一 部 分 ， 它 提供 了 各 种 
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技术 和 组 织 类 的 信息 来 帮助 识别 依赖 关系 。 但 是 ， 软 件 染 构 代 表 有 的 古 高 度 抽 象 的 结构 ， 这 可 能 会 
妨碍 正确 识别 相关 的 技术 依赖 ， 以 及 随 之 而 来 的 重要 协调 需求 。 

越 来 越 多 的 人 使 用 标准 化 设计 及 建 模 语言 (如 UML) 来 解决 这 类 问题 ， 这 些 语言 的 解决 方 
案 十 提取 信息 并 用 图 论 分 析 法 (类 似 于 软件 储存 库 挖掘 的 方法 ) 进行 分 析 。 然 后 我 们 就 可 以 看 到 
软件 架构 的 “协调 视图 ， 这 个 视图 包含 了 软件 的 技术 依赖 关系 以 及 进行 开发 工作 的 各 组 织 单位 
之 同 的 关联 。 

一 个 可 能 更 有 前 途 的 未 来 方 同 是 加 深 对 于 软件 染 构 师 的 设计 思路 〈 尤 其 是 和 技术 依赖 关系 、 
工作 依赖 关系 有 关联 的 设计 思路 ) 的 理解 。 软 件 染 构 师 很 少 在 理想 状态 下 做 设计 。 事实 上 ， 架构 
师 们 总 古 面 临 着 各 类 技术 和 非 技 术 的 限制 。 所 以 ， 他 们 的 设计 流程 总 古 充满 了 各 种 权衡 取舍 。 

举例 来 说 ， 架 构 师 们 在 做 设计 的 时 候 需要 考虑 的 约束 包括 : 

O 老 代 码 在 重组 系统 时 可 能 市 来 的 影 啊 ; 

O 老 组 织 结构 在 重新 安排 工作 时 可 能 市 来 的 影响 

O 与 用 户 需 求 无 关 的 修改 所 需 的 资源 成 本 (如 客户 可 能 不 愿意 化 钱 来 重 构 软件 平台 来 改善 

其 适应 性 )，; 

口 处 理 项 目 之 间 和 客户 之 间 的 区 别 。 

软件 架构 师 们 笛 帝 会 发 展 出 目 己 的 灵感 来 源 和 评估 方法。 迄今 为 止 ,只 有 一 套 有 限 的 设计 准 
则 存在 ， 这 套 设 计 准 则 是 从 西门 子 ““、 飞 利 浦和 摩托 罗拉 的 研究 中 派生 出 来 的 。 但 是 ， 研 
宛 人 员 以 及 准则 的 使 用 者 们 的 兴趣 却 与 日 俱 增 , 希望 能 研究 一 僚 系 统 的 方法 来 评估 软件 的 染 构 及 
修改 ， 这 人 套 方 法 将 考虑 技术 和 组 织 的 约束 条 件 ， 尤 其 是 大 型 分 布 式 开发 项 目 中 的 各 种 限制 。 


20.4.2 ”协作 软件 工程 工具 


如 前 所 述 , 研究 人 员 们 化 费 了 大 量 的 精力 来 关 广 软件 开发 的 沟通 工具 、 关 注 工 具 以 及 协调 工 
具 。 最 近 的 一 些 实证 研究 已 经 证 明了 这 些 工具 对 于 小 型 团队 的 价值 ,尽管 这 些 结论 都 是 正面 的 ， 
但 对 于 意识 工具 的 实证 评估 只 限于 小 型 团队 。 

当前 的 合作 工具 对 于 大 型 团队 或 者 大 型 项 目 也 没有 提供 足够 的 支持 。 在 这 些 环境 中 , 技术 和 
工作 依赖 关系 的 复杂 网 络 所 形成 的 关注 机 制 产生 海量 的 信息 , 使 得 协调 的 好 处 减少 。 规 模 和 信息 
过 量 的 问题 凸显 出 了 当前 协作 环境 的 重大 限制 。 从 传统 意义 上 讲 , 关注 工具 的 主要 目的 征 为 了 记 
录 分 布 式 的 团队 或 者 项 目 中 的 协调 信息 。 但 是 ,这 并 不 意味 着 就 应 该 展示 所 有 的 协调 相关 的 信息 ， 
尤其 下 那些 无 法 采取 对 应 行动 的 信息 。 

可 以 采取 行动 的 信息 包括 两 个 重要 方面 : WAEA, AUER, FRANE Aa BE 
PER SMEREK ， 并 基于 代码 中 的 依赖 关系 做 目 我 协调 ， 以 尽量 减少 目 己 的 修改 对 他 人 的 影响 
(反之 亦 然 )。 比 如 说 ,我 们 知道 有 些 开 发 人 员 会 在 提交 修改 之 前 发 邮件 给 团队 中 的 某 些 成 员 , 告 
诉 他 们 即将 发 生 的 修改 以 及 可 能 的 冲突 。 

fae, 我 们 已 经 知道 每 次 提交 部 进行 目 动 化 邮件 通知 有 的 话 很 容 多 造成 信息 过 量 , Ae A T 
开始 潜 源 忽略 它们 了 。 如 采 关 注 信 息 可 以 只 发 送 给 会 受到 当 次 修改 影响 的 人 ,其 效 琳 就 会 大 大 增 
强 。 此 外 ,信息 的 需求 第 常 是 动态 的 ， 所 以 除了 识别 正确 的 人 人 以外， 也 应 该 在 正确 的 时 间 进 行 传 
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送 。 信 息 的 需求 是 随 着 开发 人 员 的 任务 环境 而 改变 的 。 

在 以 后 , 我 们 将 有 和 希望 看 到 新 一 代 的 工具 , 这 些 工 具 将 在 更 加 社会 化 的 环境 下 结合 新 的 分 析 
和 可 视 化 技术 ， 并 模拟 当前 的 计算 机 化 社交 环境 (social computing environment) ， 以 处 理 规 模 和 
信息 过 量 的 问题 。 然后 这 些 新 工具 就 可 以 将 社会 网 络 的 方法 应 用 到 研究 人 员 们 推荐 的 合作 工具 以 
及 各 种 商业 产品 (比如 IBM 的 Rational Team Concert) 中 ,用 于 识别 各 种 组 织 边界 并 解决 这 些 协调 
的 障碍 。 


20.4.3 ”标准 化 和 灵活 度 的 平衡 


对 软件 流程 的 研究 和 对 社会 -技术 一 致 性 的 研究 有 很 多 共通 性 ， 因 为 软件 流程 的 一 大 重点 就 
征 分 析 和 管理 组 织 内 的 不 同 成 员 、 工 具 和 产品 之 间 的 关系 。 社 区 中 正在 进行 的 研究 主要 关注 于 加 
深 对 跨 企 业 的 合作 和 协调 的 了 解 ， 并 提倡 用 更 偏 癌 于 从 社会 -技术 的 视角 来 看 问题 。 

现在 ， 有 各 种 框架 (如 社会 一 技术 一 致 性 N) 可 以 帮助 我 们 评估 有 多 个 角色 跨 多 个 单位 
且 有 着 不 同等 级 的 不 确定 性 的 软件 开发 组 织 中 的 开发 流程 (如 变更 管理 流程 ) 的 协调 效能 。 我 们 
将 可 以 用 这 种 新 的 方法 配合 传统 的 流程 模型 分 析 法 来 设计 、 模 拟 和 评估 软件 流程 。 

我 们 还 有 一 些 疝 待 解决 的 研究 课题 , 包括 使 用 社会 一 技术 指标 来 改善 软件 设计 的 方法 并 使 用 
新 的 流程 和 工具 来 进行 开发 ,以 及 如 何 才能 将 流程 .互动 和 协作 工具 相互 结合 起 来 改善 协调 工作 。 
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第 21 章 
模块 化 的 效果 如 何 
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在 过 去 的 30 多 年 时 间 里 ， 人 们 一 直 都 把 “模块 化 ” 视 作 大 型 软件 开发 的 必 备 条 件 。 模 块 化 是 
将 系统 分 隔 成 多 个 小 的 软件 单位 (模块 )， 便 于 个 人 或 者 团队 进行 开发 ““， 以 此 来 控制 开发 
的 复杂 度 。 模 块 隐藏 了 各 种 内 部 设计 和 实现 ， 而 只 留 出 一 个 和 其 他 模块 联系 的 接口 ， 这样 负 责 各 
个 模块 的 开发 人 员 或 者 团队 就 可 以 相互 独立 地 工作 。 模 块 将 软件 系统 的 各 个 部 分 强制 区 分 开 来 ， 
为 它们 提供 相互 沟通 的 渠道 “， 最 大 限度 地 减少 软件 系统 中 单个 部 分 的 修改 对 其 他 部 分 的 影 
响 ” ， 并 能 在 做 出 修改 后 减少 编译 的 时 间 (各 模块 可 以 分 别 进行 编译 ) “。 

大 部 分 程序 语言 都 可 以 直接 定义 模块 ,以 帮助 开发 人 员 更 好 地 发 挥 模块 化 的 这 些 好 处 。 很 多 
面向 对 象 的 程序 语言 ， 如 Java” 等 ， 都 使 用 了 抽象 数据 类 型 来 支持 对 模块 的 细致 定义 。 此 外 , 语 
言 的 配套 技术 偶尔 也 能 提供 一 定 程度 的 模块 文 持 。 比 如 ，Java 有 一 个 配套 的 技术 叫做 OSGi， 这 个 
技术 可 以 将 类 分 成 一 个 一 个 的 束 (bundle) ， 然 后 束 与 束 之 间 通过 定义 良好 的 界面 进行 通信 。 开 
发 人 员 还 第 使 用 一 些 非 正式 的 方式 来 表示 模块 ， 比 如 使 用 层级 文件 结构 来 区 分 各 个 模块 。 

在 理想 情况 下 ,每 个 模块 部 应 该 包 伟 一 个 关注 后 。 举 个 例子 来 说 ， 如 来 我 们 有 一 个 控制 火车 
的 软件 系统 ,那么 开发 人 员 就 可 以 把 与 刹车 互动 的 部 分 定义 成 一 个 模块 , 这 样 就 能 把 刹车 部 分 的 
相关 逻辑 邦 统 一 起 来 。 不 过 在 现实 情况 下 ,我 们 无 法 总 十 这 么 清楚 地 将 各 个 关注 上 护 区 分 开 来 。 再 
回 到 火车 的 例子 ， 开 发 人 员 可 能 还 会 定义 为 一 个 模块 来 和 轨道 系统 中 的 列车 信号 系统 进行 交互 。 
有 时 候 , 刹车 模块 和 信号 模块 之 间 可 能 会 有 韭 肖 紧密 的 交互 ， 紧密 到 需要 在 刹车 模块 中 实现 信号 
模 岂 的 功能 。 例 如 ， 在 接收 到 紧急 信号 后 就 必须 立刻 启用 刹车 。 这 样 紧密 的 交互 导致 了 更 为 复杂 
的 模块 化 需求 ， 也 推动 了 面向 侧面 的 软件 开发 思想 (aspect-oriented software development) 11H% 
以 及 相关 工具 (如 AspecU) 的 发 展 ”。 这 些 新 的 思想 和 技术 提出 了 横 切 关 广 点 (crosscuting concern) 
的 概念 ， 也 让 开发 人 员 可 以 更 好 地 对 系统 进行 模块 化 。 

模块 化 就 此 成 为 软件 开发 中 的 一 种 正式 方法 。 不 过 , 它 的 效 末 真 的 像 宣传 的 那么 好 吗 ? 在 这 
一 草 中 ， 我 们 将 分 析 三 个 开源 软件 的 档案 ， 并 回答 以 下 问题 。 

O 是 不 是 大 部 分 的 代码 修改 (如 修复 茶 个 bug 或 者 改善 蘑 个 功能 性 ) 都 被 约束 在 单个 模块 内 ? 

口 当 开 发 人 员 对 代码 进行 修改 的 时 候 ， 征 否 必 须 参 芳 其 他 模块 的 代码 ” 
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O 我 们 是 耕 可 以 根据 实际 的 修改 情况 以 及 对 其 他 模块 的 参考 情况 ， 为 这 套 系 统 推 车 出 一 套 
新 的 模块 化 方案 ? 

在 开始 调查 之 前 ， 先 介绍 一 下 即将 分 析 的 几 个 软件 系统 。 要 想 让 我 们 的 回答 经 受 住 不 同 软件 
ASG ie, BAA: 第 一 ， 什 么 样 的 修改 才 有 具备 横 癌 可 比 性 ;第 二 ， 对 于 这 些 系统 都 适 
用 的 模块 定义 。 所 以 ， 我 们 将 先 定 义 “ 修 改 ” 和 “模块 ”两 个 概念 ， 再 用 这 两 个 定义 作为 分 析 的 
基础 ， 并 详细 介绍 分 析 过 程 ， 最 后 总 结 分 析 结 来 。 


21.1 所 分 析 的 软件 系统 


软件 开发 项 目 之 则 在 很 多 方面 上 都 可 能 有 所 不 同 ， 比如 项 目 所 在 的 领域 、 开 发 人 员 的 专业 程 
度 、 项 目的 规模 以 及 程序 语言 的 选择 ， 等 等 。 我 们 希望 尽量 选择 差别 大 一 些 ( 即 在 多 个 方面 都 有 
所 不 同 ) 而 又 具备 档案 信息 的 软件 开发 项 目 来 进行 分 析 。 人 很 多 项 目 都 可 以 达到 这 个 标准 。 我 们 最 
终 人 确定 了 下 面 三 个 项 目 作 为 研究 对 象 : 
口 Evolution (http:/projects.gnome.org/evolution) ，GNOME 桌 面 环 境内 置 ， 集 电子 邮件 、 地 
址 禾 和 日 历 于 一 体 的 应 用 程序 ，; 
QO Mozilla Firefox (http:/www.mozilla.com/firefox)， 受 欢迎 的 跨 平台 浏览 器 ，; 
口 Mylyn (http://www.eclipse.org/mylyn)，Eclipse 编 辑 器 的 面 同 任 务 的 界面 ， 内 置 于 标准 的 
Eclipse 发 行 版 中 。 
表 21-1 展 示 了 这 几 个 项 目 在 开发 时 间 、 主 要 语言 、 模 块 的 数量 ( 见 21.3 市 )、 代 码 行 数 以 及 修 
改 的 数量 (021.247) 上 的 区 别 。 我 们 只 计算 了 我 们 在 本 次 研究 中 分 析 过 的 修改 数量 。 
表 21-1 各 系统 概览 
项 目 第 一 版 发 布 时 间 主要 语言 模块 数量 “大概 的 源 代 码 行 数 (SLOC) * 修改 数量 

















Evolution 2001 年 12 月 C 43 300 000 1939 
Firefox 2004 年 11 月 C++ 45 4 000 000 11710 
Mylyn 2006 年 11 月 Java 18 675 000 3055 


* 源 代码 行 数 (SLOC) 是 由 cloc 工 具 (http://cloc.sourceforge.net) 来 测量 的 。 


这 个 概 贤 表 可 以 让 我 们 对 这 些 系 统 有 一 个 大 致 的 了 解 ， 但 这 个 表 并 不 能 让 人 看 到 全 有 狗 。 特 
别 是 这 些 统计 将 系统 档案 当 作 议 止 的 数据 来 分 析 ， 使 我 们 无 法 了 解 开 发 人 员 古 如 何 随 着 时 间 的 
推移 来 对 系统 进行 修改 的 。 为 了 更 好 地 理解 各 系统 在 开发 上 的 区 别 ， 我 们 还 分 析 了 它们 被 修改 
的 速率 。 

我 们 分 析 了 各 个 系统 每 天 修改 的 代码 行 数 ， 以 此 作为 修改 的 速率 。 图 21-1 按 时 间 的 推移 展示 
了 项 目的 修改 情况 。 图 中 的 点 代表 从 项 目的 代码 库 中 得 到 的 当天 的 代码 修改 数据 ， 点 的 高 度 代表 
了 当天 修改 并 提交 到 代码 库 中 的 代码 行 数 。 我 们 可 以 看 到 ，Evolution 的 特点 是 前 期 有 少量 修改 ， 
文 后 慢 慢 地 进入 了 长 时 间 的 高 度 修改 期 。Firefox 的 修改 没有 那么 频繁 ,而 日 在 某 一 时 间 点 之 后 几 
平 没 有 了 修改 ， 这 是 因为 开发 人 员 们 完成 了 3.5 版 的 工作 ， 并 转移 到 下 一 版 的 开发 上 去 了 。Mylyn 
的 修改 显示 出 了 某 种 间歇 性 的 微 增 。 
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我 们 还 可 以 通过 款 计 数据 得 到 类 似 的 结论 。 图 21-2 展 示 的 台 征 Evolution 的 素 计 修改 数据 ， 我 
们 可 以 很 明显 地 看 出 早期 的 缓慢 增长 和 后 期 的 持续 增长 。 其 他 系统 的 系 计 数据 也 是 类 似 。 





Evolution 








1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 








Firefox 
10 000 和 
z 8000 ma a è 
1H 6000 o as e % c A gy 
= 4000] ° 3 8 a2 $ | 
= o p s ® os o oo so “5 8 n = 
aie B® oP b ® o og 
2000 9 628° po io "eo a a he x eb SO 20 ge p eee a 
和 lgo 8% @ K == 08 20 90 0% 225 & Po ° 48° e oo ee ©? cre 09 qh ° Oo % 8 
om Tos oo 8o POR, ef o 2 oped Š A g’? Cy PS gre Bo 8 Ly R ud 9 w 








o 


SE. % agmi a 





图 21-1 三 个 系统 每 日 修改 代码 行 数 的 历史 数据 
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图 21-2 ”Evolution 的 累计 修改 代码 行 数 
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21.2 ”如 何 定 义 “修改 ” 


在 我 们 开始 分 析 模 块 和 修改 之 则 的 关系 之 前 ， 我 们 需要 对 “修改 ”做 一 个 统一 的 定义 。 
我 们 所 研究 的 这 几 个 项 目 都 使 用 Bugzilla (http://www.bugzilla.org) 作为 主要 的 bug 追 踪 系 统 。 
bug 报 告 虽然 名 字 中 只 有 “bug”， 但 是 实际 上 它们 并 不 只 是 用 于 追踪 缺陷 的 ， 还 用 于 追踪 新 功能 


21.2 ATEL “AFR” Zi) 


请 求 〈 在 Bugzilla 中 叫做 “改善 )。 也 就 是 说 ， 每 个 报告 都 包含 了 对 系统 进行 的 一 次 逻辑 修改 的 
信息 ， 而 这 次 修改 有 可 能 是 修复 缺陷 ， 也 有 可 能 是 添加 新 功能 。 

表 21-2 展 示 了 两 种 修改 的 比例 。 虽 然 Mylyn 的 修改 有 超过 1/4 是 属于 改善 类 ,但 对 于 这 三 个 项 
目 来 说 ， 大 部 分 的 修改 还 是 修复 系统 缺陷 。 


表 21-2 ”系统 的 修改 类 型 对 比 


项 目 修改 数量 缺陷 数量 (%) 改善 数量 〈% ) 
Evolution 1939 1792 (92.4%) 147 (7.6%) 
Firefox 11710 11 198 (95.6%) 512 (4.4%) 
Mylyn 3055 2247 (73.6%) 808 (26.4%) 
这 三 个 项 目 都 使 用 了 源 代 码 控制 系统 , Fide PR RAG a HES A DAITE EIT E EAH 
跟踪 。 每 次 提交 都 可 能 包含 对 多 个 文件 的 修改 ， 并 附带 各 种 元 数据 ， 如 提交 者 的 ID (通常 是 用 户 





名 或 者 邮件 地 址 )、 提 交 的 时 间 和 日 期 以 及 对 修改 的 文字 描述 。 

单个 逻辑 修改 可 能 会 对 应 源 代 码 控制 系统 中 的 多 个 代码 变更 提交 。 开 发 人 员 可 以 将 一 个 逻辑 
修改 细 分 为 更 小 的 子 任务 ， 完 成 每 个 子 任务 并 提交 相应 的 代码 变更 ， 然 后 再 进行 下 一 个 子 任务 。 
有 时 候 ， 一 个 新 功能 可 能 会 有 多 个 开发 人 员 参 与 开发 ， 每 个 人 都 独立 提交 他 们 目 己 变更 的 部 分 。 
虽然 这 些 代码 变更 部 是 分 别提 交 到 源 代 码 储 存 库 的 ， 但 是 它们 都 属于 同一 个 逻辑 修改 。 

所 以 ， 我 们 把 “修改 ”定义 为 一 个 bug 报 告 中 包含 的 所 有 代码 变更 提交 。 我 们 使 用 了 不 分 大 
小 写 的 规则 表达 式 /bug #? (\d+) / 来 从 代码 变更 提交 的 接 述 中 提取 bug 的 ID， 然 后 再 把 所 有 的 
处 在 同一 个 bug ID 下 的 变更 提交 组 合 起 来 。 为 了 举例 说 明 ， 请 看 看 下 面 这 三 个 拍 述 。 它 们 取 目 
Firefox 项 目 中 的 三 次 修改 提交 ， 三 者 组 合 起 来 形成 一 个 逻辑 修改 。 


Bug 385423。 重 构 上 exttrun 缓 存 ， 让 所 有 的 textrun 客 户 狐 都 使 用 同一 个 基于 单词 
的 全 局 缓存 。 把 别 除 问题 字符 〈 如 换行 符 ) 的 责任 交 给 单词 缓存 。r=vlad, smontagu 

Bug 385423, 停止 显示 零 宽 度 空 格 (ZWSP) 、 段 落 分 陪 符 (PSEP) 及 行 分 隔 符 (LSEP) , 
并 且 不 在 平台 textrun 建 立 的 时 候 传 入 这 些 字 符 , 避免 潜在 的 bug 并 强制 执行 统一 的 处 理 方 
#. r=vilad 

[OS/2] 解决 gfx0S2Fonts.cpp 无 法 编译 的 问题 (模仿 在 修复 Bug 385423 时 对 
gfxPangoFonts 做 出 的 修改 ) 


我 们 的 规则 表达 式 没 有 匹配 到 的 变更 提交 我 们 不 予 考 虑 。 就 Firefox 和 Mylyn 来 说 ， 我 们 匹配 
到 了 大 概 3/4 的 变更 提交 ， 分 别 占 总 数 的 74.7% 和 75.8%。 而 对 Evolution 来 说 ， 我 们 却 只 匹配 到 了 
19.5% 的 变更 提交 。 这 是 因为 这 个 项 目 大 部 分 的 代码 变更 提交 并 没有 明确 提 及 bug ID, MARTI 
无 法 对 这 些 提交 进行 分 析 。 

由 于 我 们 的 研究 内 容 还 包括 弄 明 白人 修改 的 泡 围 (尤其 是 单个 逻辑 修改 所 需要 参考 和 修改 的 模 
块 数量 )， 所 以 我 们 还 需要 了 解 一 下 每 个 修改 的 大 概 规模 。 图 21-3 展 示 的 古 Firefox 的 代码 修改 规 
模 ( 即 每 次 修改 过 的 代码 行 数 ) 的 分 布 情况 , 另外 两 个 项 目的 分 布 情况 也 差不多 。 修改 了 超过 1000 
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行 代码 的 修改 没有 显示 在 柱状 图 中 ， 以 市 省 空间 。 表 21-3 的 统计 包含 了 全 部 的 数据 。 
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图 21-3 ”Firefox 的 代码 修改 行 数 分 布 
表 21-3 ”修改 行 数 统计 
项 目 中 间 值 平 均值 修改 超过 100 行 的 百分比 
Evolution 24 157.2 2.0% 
Firefox 26 383.3 3.6% 
Mylyn 62 248.5 8.6% 





柱状 图 显示 ,这 些 系统 中 大 部 分 的 修改 都 非常 小 ， 而 最 右边 有 少许 非 第 大 的 修改 (如 重 构 一 
个 大 型 组 件 或 者 把 代码 从 一 个 目录 移 到 为 一 个 目录 )。 

对 于 Myly 项 目 来 说 ,我 们 还 可 以 通过 大 部 分 bug 报 告 都 附带 的 “任务 环境 ，(task context) X 
件 来 找 出 更 多 的 信息 。 正 如 我 们 前 面 简 单 提 到 过 的 ,Mylyn 古 Eclipse IDE 的 一 个 面向 任务 的 界面 。 
它 有 一 项 功能 是 跟踪 记录 开发 人 员 在 进行 任务 时 所 交互 过 的 所 有 软件 部 件 。Mylyn 对 于 进行 任务 
时 的 一 些 “有趣” 的 代码 元 素 进 行 了 记录 。 这 些 元 素 不 但 包括 修改 过 的 属性 和 方法 ， 其 至 那些 仅 
仅 是 在 编辑 器 中 浏览 过 的 代码 元 素 也 包含 在 内 “。 然 后 开发 人 员 就 可 以 使 用 这 些 任务 环境 数据 来 
过 究 Eclipse 中 的 视图 ;让 它们 只 显示 开发 人 员 感 兴趣 的 元 素 , 让 开发 人 员 可 以 只 关注 和 当前 任务 
相关 的 那 部 分 。 
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Mylyn 项 目 有 个 政策 ， 那 就 是 解决 bug 的 时 候 ， 必 须 先 在 相应 的 bug 报告 下 建立 新 的 任务 。 当 
开发 人 员 完 成 任务 之 后 , 他 需要 将 Mylyn 收 集 到 的 任务 环境 信息 附加 在 bug 报 告 上 。 这 样 ， 其 他 开 
发 人 员 就 可 以 导入 相关 的 任务 环境 信息 到 自己 的 Mylyn 环 境 ， 并 可 以 从 解决 问题 的 那个 开发 人 员 
的 角度 来 分 析 系 统 和 修改 。 

图 21-4 展 示 的 就 是 一 个 任务 环境 的 例子 。 任 务 环 境 中 加 粗 的 元 素 由 于 和 该 任务 密切 相关 ， 所 
以 使 用 了 更 突出 的 格式 来 显示 。 图 中 左上 角 的 滑动 条 代表 元 素 的 相关 程度 , 开发 人 员 可 以 滑动 它 
来 过 滤 想 要 查看 的 元 素 。 开 发 人 员 们 通常 不 会 使 用 图 中 这 种 视图 来 进行 工作 , 而 是 利用 任务 环境 
信息 来 过 滤 其 他 IDE 视 图 ， 使 其 只 显示 相关 的 语言 元 素 。 图 21-4 中 的 视图 主要 是 用 于 展示 在 附加 
到 bug 报 告 之 前 的 背景 信息 。 

每 个 任务 环境 数据 中 都 包含 了 时 间 戳 , 可 以 用 来 估计 开发 人 员 在 这 个 修改 上 大 概 花 了 多 少时 
间 。 各 种 “交互 事件 ”都 有 时 间 樵 信息， 包括 选择 事件 (如 当 开 发 人 员 点 击 源 代码 中 的 元 素 的 时 
使)、 编 辑 事件 〈 当 开发 人 员 修改 编辑 器 中 的 文字 的 时 候 ) 以 及 命令 事件 ( 当 开发 人 员 调用 IDE 命 
令 的 时 候 ) 。 可 以 预见 的 是 ， 当 一 个 开发 人 员 正 在 进行 工作 的 时 候 ， 会 频繁 地 触发 这 些 事件 ， 
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图 21-4 Mylyn 视 图 下 的 修改 附加 的 任务 环境 
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总 而 言 之 ， 当 我 们 分 析 Mylyn 的 代码 修改 情况 时 ， 我 们 可 以 从 两 处 获得 数据 : 源 代码 控制 系 
统 中 的 提交 记录 ,让 我 们 可 以 得 知 开 发 人 员 对 代码 的 修改 ; 还 有 连接 到 bug 报 告 的 任务 环境 文件 ， 
让 我 们 可 以 得 知 开发 人 员 在 做 修改 时 所 进行 的 步骤 。 从 任务 环境 中 储存 的 时 间 戳 信息 我 们 可 以 佑 
计 开 发 人 员 大 概 花 在 茶 个 bug 上 的 时 间 。 这 至 少 让 我 们 可 以 对 这 个 系统 的 修改 情况 进行 更 深入 的 
分 析 ， 找 出 开发 人 员 和 系统 的 模块 交互 的 更 详细 的 信息 ， 而 不 是 仅仅 去 看 最 终 的 修改 结 末 。 


21.3 如何 定义 “模块 ” 


要 想 讨论 开发 人 员 是 如 何 和 软件 系统 中 的 模块 交互 ,我们 就 必须 要 对 “模块 ”有 一 个 统一 的 
定义 ， 并 且 和 弄 清 楚 模块 之 间 的 代码 是 如 何 区 分 开 来 的 。 

虽然 说 我 们 可 以 直接 用 源 代码 中 的 声明 来 作为 模块 的 定义 标准 ， 但 是 对 于 我 们 的 研究 来 说 ， 
这 样 的 选择 面临 两 个 问题 。 首 先 ,我 们 选择 研究 的 项 目 是 用 不 同 的 语言 来 写成 的 ， 这 些 语言 处 理 
模块 的 方式 各 有 不 同 。 比 如 ，Evolution 是 用 C 写 成 的 ，C 语 言 基本 不 支持 在 源 代 码 中 定义 模块 。 
而 Firefox 主 要 使 用 C++， 这 种 语言 使 用 命名 空间 的 方式 来 定义 模块 ， 但 是 Firefox 本 里 并 没有 统一 
地 使 用 这 个 语言 特性 来 定义 模块 ,此 外 ,Firefox 还 包含 了 很 多 用 其 他 语言 写 的 代码 ,比如 JavaScript 
和 XUL (XML User Interface Language) 等 ， 都 有 着 各 自 不 同 的 模块 化 的 方式 。 而 Mylyn 使 用 Java 
写成 ， 是 三 个 系统 中 唯一 一 个 在 产 代 码 中 明确 定义 了 模块 的 系统 ， 使 用 的 方法 是 Java 包 。 

其 次 , 我 们 选择 研究 的 几 个 系统 都 是 足够 大 而 且 存 在 时 间 很 入 的 , 以 至 于 如 果 我 们 太 追 究 编 
程 语言 上 的 细 证 问题 的 话 , 我 们 的 研究 结果 就 可 能 就 会 受到 与 开发 相关 的 问题 (比如 开发 团队 成 
员 的 替换 或 者 代码 的 重 构 ) 的 巨大 影响 。 为 了 减少 这 些 问 题 的 影响 ,我 们 将 采用 稍微 粗略 一 点 的 
方式 来 关注 模块 的 问题 ， 即 从 架构 的 角度 来 看 待 模块 。 当 然 ， 如果 能 使 用 更 为 细 化 一 些 的 模块 定 
义 来 做 后 续 研 究 应 该 会 很 有 趣 。 

最 后 , 我 们 没有 使 用 编程 语言 的 特性 来 作为 模块 的 定义 标准 , 而 是 使 用 了 每 个 系统 储存 代码 
的 目录 结构 。 我 们 接 下 来 即将 证 明 , 这 些 项 目 文 件 系 统 的 组 织 方 式 可 以 作为 一 个 通用 的 模块 定义 
标准 。 此 外 ,使 用 目录 作为 模块 的 定义 标准 还 免除 了 我 们 区 分 不 同 模块 的 困难 ， 因 为 不 同 模块 就 
在 不 同 的 位 置 上 。 

Evolution 和 Firefox 都 使 用 了 倘 单 的 目录 结构 ， 和 我 们 在 电脑 上 使 用 的 结构 差不多 : 每 个 顶级 
目 永 代 表 独 一 个 主要 系统 组 件 ， 各 个 子 目 永 把 这 个 组 件 再 分 成 儿 个 稍 小 的 子 组 件 。 下 面 是 Firefox 
软件 库 的 一 向 . 














layout network parser 
/base /base /expat 
/generic /cache /htmlparser 
/inspector /cookie /xml 


每 个 子 目 录 都 可 能 包含 更 多 的 子 目 录 ， 将 源 代 码 、 测 试 文件 和 文档 区 分 开 来 。 

对 于 这 样 的 目录 结构 , 我 们 有 两 种 备 选 的 模块 定义 方案 。 往 高 了 说 , 每 个 顶级 目录 (如 layou?) 
都 可 以 被 看 做 一 个 模块 ， 往 下 一 点 说 ， 每 个 顶级 目 孙 的 子 目 孙 〈 如 layoutbase) 都 可 以 被 看 成 是 
一 个 独立 的 模块 。 
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Evolution 是 我 们 研究 的 三 个 项 目 中 最 小 的 一 个 ,我 们 采取 前 一 种 定义 。Firefox 要 比 它 大 上 几 
个 数量 级 ， 所 以 我 们 采取 后 一 种 定义 。 如 果 使 用 前 一 种 定义 ( 即 仅 用 顶级 目录 ) 来 看 Firefox， 我 
们 将 得 到 巨大 无 比 的 模块 ， 这 个 模块 将 包罗 万 象 ， 让 我 们 无 法 探知 系统 中 各 个 模块 之 间 的 关联 。 
而 如 有 果 我 们 对 Evolution 使 用 子 目录 的 定义 方法 ,那么 所 得 到 的 数据 就 会 混杂 不 堪 ， 使 我 们 无 法 对 
其 进行 有 效 的 分 析 。 

Mylyn 的 目录 结构 和 另外 两 个 项 目 完全 不 同 。Java 的 源 文件 是 按照 其 所 对 应 的 包 的 声明 来 组 
组 的 ， 这 样 的 结构 盘根错节 ， 比 C/C++ 系 统 的 目 孙 层次 要 多 很 多 。 这 些 Java 包 最 后 又 将 组 合 形成 
Eclipse 的 子 项目 《“ 即 Eclipise IDE 项 目下 的 各 个 顶级 日 好 )， 而 这 些 项 目 本 身 也 是 按照 同样 的 命名 
标准 来 组 织 的 。 下 面 是 Mylyn 的 软件 库 一 入 . 


org.eclipse.mylyn.bugzilla.core 
/src/org/eclipse/mylyn/internal/bugzilla/core 
/history 
/service 
org.eclipse.mylyn.bugzilla.ui 
/src/org/eclipse/mylyn/internal/bugzilla/ul 
/action 
/editor 
/search 





org.eclipse.mylyn.context.core 
/src/org/eclipse/mylyn/context 
/core 
/internal/core 


和 另外 两 个 系统 一 样 ， 针 对 这 样 的 结构 我 们 也 有 和 此 前 一 样 的 两 个 定义 方法 。 代 表 着 Eclipse 
子 项 目的 顶级 目录 大 致 相当 于 Evolution 和 Firefox 中 顶级 目 孙 的 子 目 未 。 如 采 再 往 上 层 说 ， 我 们 还 
可 以 按照 目录 名 字 中 的 mylyn 之 后 的 第 一 个 词 来 定义 组 件 。 比 如 说 ,org.eclipse.mylyn.bugzilla.core 
和 org.eclipse.mylyn.bugzilla 都 可 以 被 看 做 是 更 大 的 bugzilla 组 件 的 一 部 分 。 事实 上 ， 如 果 我 们 看 一 
看 Java 包 的 结构 ， 这 两 个 目录 都 只 包含 属于 org.eclipse.mylyn.bugzilla 中 的 代码 ， 所 以 这 个 选择 也 
Pia SWI. 

所 以 我 们 采取 了 Evolution 的 顶级 目录 定义 法 ， 而 不 是 Firefox 的 子 目录 定义 法 ， 即 采取 
org.eclipse.mylyn 的 直接 子 目 录 作 为 模块 的 定义 标准 。 这样 , 我 们 就 可 以 把 存在 于 不 同 子 目 录 中 的 
核心 逻辑 和 UI 组 件 都 看 做 同一 模块 的 不 同 部 分 。 


21.4 ”研究 结果 


我 们 已 经 对 “修改 ”和 “模块 ”做 了 具体 而 统一 的 定义 ,现在 终于 可 以 开始 分 析 开 发 人 员 如 
何 利用 这 些 模 块 进行 工作 了 。 


21.4.1 ”修改 的 范围 


我 们 的 用 一 个 简单 的 问题 作为 研究 的 开场 : 是 否 大 部 分 的 修改 都 被 限定 在 了 单个 模块 内 ? 
21-5 展 示 的 是 代码 修改 所 影响 到 的 模块 数量 ， 而 表 21-4 征 相关 的 总 结 统计 。 
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图 21-5 每 个 修改 在 各 个 系统 中 所 改变 的 模块 数量 
表 21-4 ”修改 影响 到 的 模块 数量 


只 影响 了 一 个 模块 的 百分比 平均 影响 模块 的 数量 
86.6% 1.243 
73.7% 1577 
69.7% 1.634 
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21.4.2 ”需要 参考 的 模块 


在 修改 代码 的 时 候 ， 开 发 人 员 必 须 参 考 多 少 模块 ?由 于 Mylyn 有 相关 的 数据 ， 所 以 我 们 可 以 
通过 数字 来 回 谷 这 个 同 题 ， 但 十 男 外 两 个 系统 就 不 行 了 。 

图 21-6 展 示 的 是 当 开 发 人 员 做 出 修改 的 时 候 参 考 过 的 模块 数量 , 平均 数 是 2.365, 中 位 数 是 2。 
参考 过 的 模块 平均 数 比 实际 修改 的 模块 平均 数 (1.634) 要 高 ， 也 就 征 说 ， 开 发 人 员 偶 尔 会 需要 
参考 一 些 他 们 最 终 不 需要 修改 的 模块 。 

如 琳 我 们 再 仔细 看 看 参 旁 过 而 又 没有 修改 过 的 模块 ， 就 可 以 发 现 两 个 Mylyn 模 块 非 第 突出 。 
在 13% 的 修改 中 ， 开 发 人 员 参 考 了 Tasks 模 块 但 是 没有 修改 它 ， 而 在 8% 的 修改 中 ， 开 发 人 员 对 
Bugzilla 模 块 也 征 如 此 。 我 们 可 能 会 推断 ，Iasks 和 Bugzilla 相 比 其 他 的 模块 来 说 凝聚 度 较 低 ， 又 或 
者 说 它们 和 其 他 很 多 模块 有 所 耦合 。 我 们 稍 候 将 用 开发 人 员 和 系统 的 互动 来 定义 模块 ， 届 时 我 们 
FEA A IX HET ze N EM. 

那么 , 参考 的 模块 数量 对 于 完成 任务 所 需 的 时 间 有 着 什么 影响 ?我 们 的 假设 是 ， 当 开发 人 员 
参考 的 模块 数量 越 多 ,完成 任务 所 需 的 时 间 也 就 越 多 。 我们 的 数据 确实 支持 了 这 一 假设 : 数据 显 
示 ， 参 考 的 模块 数量 和 任务 所 花费 的 时 间 之 间 有 弱 相 关 性 (相关 系数 r=0.20, p <10 “)。 
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图 21-6 ”Mylyn 的 每 个 修改 所 参考 的 模块 数量 
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不 同 的 开发 人 员 所 参考 的 模块 数量 是 否 也 不 同 ? 特 别 是 : 经 验 更 丰 遇 的 开发 人 员 需 要 参考 的 
模块 是 否 更 少 ? 我 们 可 以 用 开发 人 员 关 闭 bug 报 告 的 数量 来 估计 其 对 系统 的 了 解 和 经 验 。 将 这 个 
数据 和 每 个 修改 中 参考 但 未 修改 的 模块 数量 相 结 合 ， 我 们 就 可 以 得 出 图 21-7 中 表示 的 结 东 。 
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5 10 
参考 但 未 修改 的 模块 数 
图 21-7 开发 人 员 的 经 验 以 及 参考 但 未 修改 的 模块 数量 对 比 。 经 验 的 衡量 标准 是 开发 

人 员 在 做 出 修改 前 所 关闭 的 bug 报 告 数量 
我 们 在 图 的 左边 部 分 来 说 并 没 发 现 什 么 差别 , 新 手 和 老手 在 做 修改 时 都 经 笛 参 苍 少 量 其 他 的 
模块 。 但 是 ,在 图 的 右边 部 分 ,情况 就 完全 不 一 样 了 ,需要 参考 很 多 其 他 模块 的 开发 人 员 大 都 没 
什么 经 验 。 


21.4.3 目 发 式 的 模块 化 


到 目前 为 止 , 我 们 的 所 有 分 析 都 是 基于 一 个 前 提 ， 那 就 是 用 这 些 系 统 的 文件 结构 来 区 分 模块 
是 恰当 的 。 我 们 现在 换 一 个 视角 来 看 这 个 问题 ; 能 不 能 从 开发 人 员 的 交互 模式 中 推断 出 模块 的 定 
SWE? 开发 人 员 在 工作 时 上 自发 形成 的 模块 分 化 与 系统 设计 时 明确 定义 的 模块 是 否 不 同 ? 前 面 的 
统计 结 末 已 经 表明 ,对 Evolution 的 修改 儿 乎 总 是 只 改动 一 个 模块 〈 占 总 数 的 86.6%) ， 所 以 我 们 这 
个 阶段 的 研究 将 主要 关注 Firefox 和 Mylyn。 

我 们 首先 将 同时 修改 过 的 模块 配对 ， 并 对 这 些 配对 出 现 的 频率 做 了 简单 的 统计 。 对 Firefox 
来 说 ， 出 现 频率 至 少 在 1% 的 配对 分 别 是 : 


browser/base, browser/themes 
browser/places, toolkit/places 


21.4 研究 结果 285 


layout/base, layout/generic 
browser/themes, toolkit/themes 
toolkit/locales, toolkit/mozapps 
browser/base, browser/locales 
toolkit/content, toolkit/themes 


从 这 个 列表 中 我 们 可 以 观察 到 几 点 。 弟 先 ， 顶 级 目录 下 的 “base” 模 块 看 上 去 似乎 和 同 目录 
下 的 其 他 的 模块 有 着 紧密 的 而 合 。 从 设计 的 角度 来 看 ， 这 一 点 似乎 并 没有 问题 。 其 次 ， 不同 顶级 
目 如 下 同样 名 称 的 模块 也 第 第 同时 被 修改 : 比如 browser/places 和 toolkit/places 营 第 同时 被 修改 ， 
同样 的 还 有 browser/themes 和 toolkit/themes。 它们 相似 的 命名 表明 系统 架构 师 意识 到 有 多 种 细 分 系 
统 的 方法 ， 也 表明 可 能 会 出 现 横 切 (crosscutting) 的 问题 ， 而 且 选 择 任何 一 种 模块 化 的 方法 都 可 
能 造成 系统 中 高 度 疑 聚 的 部 分 被 分 散 到 多 个 模块 。 而 对 于 Firefox 来 说 ， 将 browser 和 toolkit 分 成 两 
个 组 件 就 导致 了 places 和 themes 组 件 的 分 散 。 

最 有 趣 的 是 那些 不 符合 这 两 种 解释 的 组 件 关联 。 从 前 面 的 列表 中 我 们 可 以 看 到 ,toolkiVlocales 
和 toolkitmozapps 亿 平 有 着 基 种 关联 ,同样 的 还 有 toolkiVcontent 和 ltoolkitthemes。 对 这 些 配对 模块 
的 修改 细 贡 的 深入 研究 显示 ， 系 统 的 某 些 功能 性 其 实 可 以 提取 出 来 ， 放 到 一 个 凝聚 度 更 高 一 些 的 
模块 中 去 。 

在 对 Mylyn 采 取 同 样 的 研究 之 后 ， 我 们 发 现 了 下 和 面 这 些 配 对 : 


tasks, bugzilla 





tasks, context 
tasks, jira 
tasks, help 
tasks, commons 
tasks, trac 


我 们 很 容易 就 能 看 出 来 : 开发 人 员 修 改 tasks 模 块 时 常常 也 会 修改 其 他 模块 。 我 们 可 以 回想 一 下 
之 前 的 统计 结果 ， 在 所 有 的 修改 中 ， 有 13% 参 注 了 tasks 模 块 但 是 却 没 有 修改 它 。 将 这 个 结果 和 我 们 
观察 到 的 配对 情况 相 结 合 ， 我 们 就 可 以 证 明 Mylyn 和 tasks 模 块 和 系统 的 其 他 部 分 是 高 度 厢 合 的 。 

为 了 发 掘 tasks 模 块 和 系统 其 他 部 分 的 关系 , 我 们 采取 了 一 种 寻找 数据 之 间 的 关联 规律 的 数据 
安 抉 方法， 名 为 “多 发 模式 挖 所 法 ”(frequent pattern mining) “|。 我 们 用 这 种 方法 对 Mylyn 的 任 
务 环境 数据 进行 挖掘， 和 希望 能 发 现 开 发 人 员 在 做 修改 时 参考 其 他 模块 的 某 些 规律 。 在 本 次 研究 
的 环境 中 ,我 们 得 出 的 结果 将 以 这 样 的 形式 出 现 : 对 于 同一 个 修改 ,如 采 开 发 人 员 参 苍 了 模块 A， 
那 他 就 有 可 能 会 去 参考 模块 B。 找 出 的 每 条 规律 都 有 一 个 可 信和 度 ， 这 个 数值 代表 着 这 条 规则 所 履 
盖 的 数据 集 的 百分比 。 我 们 对 任务 环境 的 数据 控 掘 得 出 了 以 下 结 采 : 

doc -> tasks (100%) 

help -> tasks (100%) 

trac -> tasks (84%) 

team -> tasks (82% 


6 ) 
bugzilla -> tasks (81%) 
jira -> tasks (81%) 








D 关联 规律 是 由 ARtool 实 现 的 Apriori 算 法 生成 的 (http://www.cs.umb.edu/~laur/ARtool) 。 
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这 些 还 只 是 可 信和 度 超 过 80% 的 规律 。 我 们 可 以 看 出 ， 开 发 人 员 在 进行 某 个 任务 的 时 候 ， 只 要 
参考 了 箭头 前 面 的 6 个 模块 〈 如 doc，help 等 )， 就 很 有 可 能 还 需要 参考 tasks 模 块 。 

在 确定 了 在 Mylyn 中 的 “条 条 大 路 通 tasks” 这 个 规律 之 后 ， 我 们 可 以 再 深入 研究 一 下 这 些 模 
块 之 则 的 联系 是 否 处 在 “类 ”这 个 层面 上 。 首先 , 我 们 对 任务 环境 数据 进行 了 挖掘 (从 类 的 角度 )， 
并 提取 了 以 下 这 些 可 信和 度 超过 60% 的 结果 : 


NewBugzillaTaskEditor -> AbstractRepositoryTaskEditor (88%) 
BugzillaTaskEditor -> AbstractRepositoryTaskEditor (85%) 
NewBugzillaTaskEditor -> BugzillaTaskEditor (79%) 
IBugzillaConstants -> BugzillaClient (71%) 
JiraRepositoryConnector -> AbstractRepositoryConnector (63%) 








BugzillaRepositorySettingsPage -> AbstractRepositorySettingsPage (62%) 
SynchronizeTaskJob -> RepositorySynchronizationManager (61%) 


PATTER HAE AIK PEG ASHE DD AS SLE AR eG SZ. TA TAR o FRA N T ED A, 
抽象 类 及 其 具体 实现 的 子 类 ， 这 看 上 去 似乎 是 比较 合理 的 ， 所 以 对 这 些 关 系 我 们 并 不 感到 意外 。 

如 林 我 们 改变 策略 ,对 修改 数据 进行 数据 挖掘 ， 只 芳 虑 那些 实际 修改 过 而 不 是 仅仅 参考 过 的 
类 ， 了 最 后 我 们 得 到 了 截然 不 同 的 结 末 〈 仅 列 出 可 信 度 超过 70% 的 结 采 ): 


ITaskListExternalizer -> BugzillaTaskExternalizer (87%) 
NewAttachmentWizard -> AbstractRepositoryTaskEditor (81%) 
AbstractJavaRelationshipProvider -> XmlReferencesProvider (80%) 
ActiveHierarchyView -> ActiveSearchView (76%) 
PdeStructureBridge -> AntStructureBridge (75%) 
RepositoryTaskAttribute -> AbstractRepositoryTaskEditor (74%) 
ContextRetrieveAction -> ContextAttachAction (74%) 

TaskCategory -> TaskListView (713%) 

ContextAttachAction -> ContextRetrieveAction (71%) 


这 些 结果 让 我 们 看 到 了 系统 的 另外 一 面 。 比 如 ， 我 们 可 以 看 到 ActiveHierachyView 和 
ActiveSearchView 之 旧 的 紧密 联系 ， 同 样 的 下 有 ContextRetrieveAction 和 ContextALttach- 
Action。 这 些 View 之 间 ， 以 及 Action 之 间 ， 可 能 都 有 着 某 种 公用 的 功能 性 ， 而 这 些 功能 性 也 许 
应 该 被 提取 到 独立 的 类 里 面 。 有 些 关 联 是 出 乎 我 们 意料 的 。 比 如 , 我 们 不 太 明 白 PdeStructure- 
Bridge 和 AntStructureBridge 为 什么 会 有 如 此 紧密 的 关联 ， 因 为 虽然 它们 是 从 一 个 基本 类 派 
生出 来 的 两 个 子 类 ， 但 是 两 个 类 的 实现 却 是 大 相 径 庭 。 

这 样 的 结果 表明 ， 对 于 Mylyn 这 个 项 目 来 说 ， 从 同时 修改 的 角度 来 做 模块 划分 可 能 与 用 Java 
包 和 类 来 做 的 模块 有 很 大 差别 。 当 两 种 划分 模块 的 方式 产生 分 上 至 的 时 候 ,， 即便 只 是 做 一 个 很 小 的 
逻辑 修改 ， 开 发 人 员 也 可 能 需要 更 多 地 参考 和 顾及 系统 的 其 他 部 分 。 




















21.5 ”有效 性 的 问题 


我 们 研究 的 基础 是 : 使 用 bug 报 告 来 作为 系统 修改 的 逻辑 单位 。 这 个 基础 的 有 效 性 面临 的 第 
一 个 问题 就 是 我 们 用 了 简单 的 模式 匹配 技术 来 关联 bug 报 告 和 修改 提交 。 使 用 模式 匹配 并 不 能 保 
证 可 以 找 出 bug 报 告 和 代码 变更 提交 之 同 的 所 有 关联 : 有 一 些 变更 提交 摘 述 中 的 pug ID 使 用 了 不 
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标准 的 格式 ， 我 们 的 规则 表达 式 无 法 匹配 到 ， 而 有 的 变更 提交 可 能 根本 就 没有 明确 提 到 bug ID, 
特别 是 Evolution， 对 于 这 个 项 目 我 们 只 匹配 到 差不多 20% 的 变更 提交 ， 这 使 我 们 只 能 研究 这 个 项 
目的 一 小 部 分 历史 ， 而 无 法 笑 探 其 全 貌 。 

关于 有 效 性 的 第 二 个 问题 来 日 Bugzilla 软 件 仓 库 的 干扰 。 我们 认为 每 个 bug 报告 都 对 应 到 一 个 
单独 的 逻辑 修改 ， 但 是 事实 并 非 如 此 。 比 如 ， 有 的 报告 描述 的 是 日 名 软件 维护 《如 升级 第 三 方 的 
软件 库 到 最 新 版 )， 而 这 样 的 报告 和 我 们 想 要 的 研究 报告 〈 即 缺陷 修复 或 者 功能 改善 ) 的 特点 完 
全 不 同 。 

这 次 研究 的 内 部 有 效 性 的 主要 问题 是 我 们 的 数据 和 得 出 的 结论 之 间 的 关联 。 我们 做 出 的 很 多 
结论 都 古 对 数据 的 主观 诠释 ， 所 以 如 琳 有 不 同 的 结论 也 很 正 第 。 但 我 们 可 以 用 两 点 来 量化 我 们 结 
论 的 有 效 性 。 首 先 ， 我 们 的 分 析 结 琳 显 示 ， 参 注 的 模块 数量 和 修改 所 花 的 时 间 古 紧密 相关 的 ， 其 
皮尔 森 相 关系 数 达 到 了 99%。 其 次 ， 对 于 从 Mylyn 的 任务 环境 和 修改 数据 中 挖 据 出 来 的 每 条 关联 
规律 部 有 对 应 的 可 信 度 ， 而 我 们 只 选择 可 信 度 较 高 的 规律 进行 分 析 。 

所 以 ， 我 们 的 研究 结 来 是 有 可 能 无 法 推广 到 其 他 完全 不 同 的 系统 的 。 对 于 外 部 有 效 性 来 说 ， 
也 有 两 个 问题 。 首 先 , 我 们 只 分 析 了 三 个 系统 。 虽 然 我 们 选择 的 三 个 系统 在 各 个 层面 (如 程序 语 
言 、 规 模 、 开 发 时 间 ) WANDE, 但 是 如 来 我 们 想 要 将 我 们 的 研究 结 末 概括 推广 ， 这 样 的 几 个 
系统 还 是 太 少 。 而 且 ， 这 几 个 系统 中 只 有 一 个 〈 即 Mylyn) 有 关于 开发 人 员 做 修改 时 对 其 他 模块 
进行 参考 的 数据 。 其 次 ,我 们 分 析 的 这 三 个 系统 都 是 开源 的 ， 这 就 意味 着 修改 的 模 却 可 能 和 商业 
系统 不 同 。 


216 总结 


我 们 研究 了 三 个 不 同 规模 的 开源 系统 档案 , 目的 是 探索 开发 人 员 如 何 和 这 些 系 统 所 定义 的 模 
块 来 进行 交互 。 虽然 这 些 系 统 的 规模 、 领 域 和 编程 语言 部 有 所 不 同 , 但 我 们 仍然 发 现 了 它们 之 间 
的 一 些 共 性 。 首 先 ， 我 们 如 愿 地 观察 到 大 部 分 的 修改 都 被 限定 在 了 单个 模块 的 范围 内 。 但 是, 我 
们 同时 也 发 现 了 大 量 需要 器 多 个 模块 的 修改 , 这 让 开发 人 员 不 得 不 参考 系统 的 其 他 部 分 , 并 在 进 
行 修改 的 过 程 中 花费 更 多 的 时 间 。 其 次 ,我们 使 用 了 开发 人 员 的 视角 来 看 竺 这 些 修改 ,对 任务 环 
芝 信 息 进行 了 数据 挖 气 , 找 出 了 开发 人 员 在 进行 修改 时 常 弟 会 参考 或 者 同时 修改 的 文件 及 类 , 并 
发 现 用 这 种 方法 来 划分 出 来 的 模块 和 系统 设计 时 划分 的 模块 并 不 一 定 一 致 。 

这 些 结果 表明 ,虽然 从 目前 看 来 ,模块 化 方法 对 开发 人 员 的 工作 应 该 是 有 好 处 的 , 但 是 仍然 
有 改进 的 空间 。 比 如 说 ， 如 采 有 工具 可 以 帮助 开发 人 员 碍 看 同事 在 处 理 同 类 修改 的 时 候 参 考 过 的 
模块 , 那么 做 修改 所 需要 的 时 间 就 有 可 能 降低 。 对 开发 人 员 和 系统 模块 之 间 的 互动 的 研究 可 能 
明 系 统 有 重新 模块 化 的 需要 , 也 有 可 能 表明 我 们 需要 一 些 新 的 语言 特性 , 以 帮助 开发 人 员 更 好 地 
从 多 个 角度 来 表示 系统 中 的 模块 。 
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第 22 章 
设计 模式 的 证 据 


Walter Tichy 


设计 模式 是 用 于 解决 各 种 设计 问题 的 可 重复 使 用 的 解决 方案 。 在 1995 年 Erich Gamma A 
写 了 阁 名 的 《设计 模式 》 一 书 之 后 , 这 个 概念 未 源 开 始 流 行 开 来 。 在 引入 设计 模式 这 个 概念 之 前 ， 
程序 员 们 在 设计 软件 的 架构 的 时 候 只 能 依靠 少数 几 个 一 般 设 计 准 则 。 比 如 信息 隐藏 准则 , 即 把 软 
件 分 成 数 个 模块 ,模块 的 接口 保持 不 变 。 这 条 准则 确保 对 模块 内 部 的 改动 不 会 影响 到 接口 ， 所 以 
即便 模块 有 了 改动 ， 使 用 模块 的 软件 也 无 需 跟 着 改动 。 这 条 准则 古 由 Parnas 在 研究 了 改动 频 营 的 
软件 之 后 总 结 出 来 的 。 

而 设计 模式 比 起 这 些 一 般 准 则 来 说 ， 又 更 进 了 一 步 : 这 些 模 式 针 对 的 是 具体 的 设计 回 题 。 也 
就 是 说 ， 设 计 模式 就 是 设计 好 的 “算法 。 设 计 模 式 和 算法 都 征 解决 具体 问题 的 方法 。 比 如 ， 快 
速 排序 算法 就 是 为 了 解决 排序 的 问题 , 而 观察 者 模式 则 是 为 了 解决 传递 更 新 信息 到 软件 组 件 的 问 
题 。 一 般 来 说 ,程序 员 们 无 法 直接 使 用 书本 上 的 算法 ， 因 为 它们 通常 是 用 伪 语 言 来 表达 的 。 要 想 
使 用 这 些 算法 ,程序 员 必 须 对 它们 进行 调整 、 修 改 ， 并 将 这 个 算法 对 应 到 目标 程序 语言 。 在 这 一 
尽 上 ,设计 模式 也 是 一 样 ， 它 们 也 不 古 设 计 定 往 。 实 际 上 ， 它 们 所 插 述 的 只 是 通用 的 软件 结构 以 
及 软件 组 件 之 间 的 交互 ， 必 须 通 过 修改 以 适应 具体 情况 。 

设计 模式 的 文 持 者 们 声称 它 有 以 下 这 些 优点 : 

O 提高 软件 质量 ， 

O 提升 程序 员 效 率 ，; 

O 促进 团队 沟通 ， 

口 改善 彻 级 程序 员 的 设计 水 平 。 

在 设计 模式 刚刚 出 现 的 那些 年 头 ,， 疫 人 知道 设计 模 却 是 不 是 真 的 有 这 些 优点 。 在 那 时 ， 经 验 
丰富 的 程序 员 们 已 经 经 历 了 很 多 又 花 一 现 的 编程 泣 流 ， 所 以 不 愿意 再 花 时 间 和 精力 在 新 的 背 流 
E. “设计 方法 ”这 一 领域 已 经 是 人 满 为 患 了 : 这 个 领域 包括 了 结构 设计 、 功 能 设计 、 数 据 抽象 
化 、 模 块 化 设计 、 面 咎 对 象 的 设计 、 多 施 式 设计 、 染 构 风 格 、 重 构 ， 等 等 。 谁 又 会 浪费 时 间 在 这 
种 新 推出 又 疫 经 过 验证 的 所 谓 设 计 模 式 上 呢 ? 不 过 万 一 这 个 模式 征管 用 的 呢 ? 我 们 怎么 来 解决 
这 个 问题 ”应 该 听信 相关 书籍 作者 的 言论 、 个 人 的 经 验 , 还 是 顾问 的 建议 ?这 些 渠 道 要 么 过 于 主 
Wh, 要 么 就 是 基于 个 人 经 验 的 一 家 之 谈 。 要 想 客观 地 验证 设计 模式 的 这 些 好 处 是 否 可 信 ， 只 有 一 
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个 办 法 : 客观 地 观 峙 程序 员 的 工作 ， 更 确切 地 说 ， 就 是 进行 一 次 科学 的 实验 。 这 个 实验 将 找 出 使 
用 和 不 使 用 设计 模式 所 造成 的 差别 。 如 末 设 计 模 式 真 的 能 如 声称 的 那样 可 以 大 幅 提 升 效率 和 质 
量 ， 那么 我 们 应 该 能 够 观察 到 一 些 产 别 。 由 于 设计 模式 所 承诺 的 的 优点 太 多 , 单独 的 一 个 实验 将 
无 法 测试 所 有 的 优点 ， 所 以 ， 在 1996 年 ， 我 和 我 的 学 生 决 定 开始 一 系列 的 实验 。 在 这 个 过 程 中 ， 
我 们 不 但 学 到 了 很 多 关于 设计 模式 的 知识 , 还 了 解 到 了 软件 研究 中 的 很 多 实验 方法 。 在 我 们 了 解 
这 些 方法 之 前 ， 不 妨 先 来 看 看 设计 模式 是 什么 ， 这 将 让 我 们 大 概 了 解 其 原理 和 意义 。 


22.1 设计 模式 的 例子 


在 这 一 章 中 包括 对 下 面 7 个 设计 模式 (有 时 儿 个 模式 一 起 ) 所 进行 的 实验 : 抽象 工厂 模式 
(Abstract Factory) 、 桥 模式 (Bridge)、 组 合 模 式 (Compositum)、 装 饰 者 模式 (Decorator), 
观察 者 模式 (Observer)、 模 板 方 法 (Template Method) 以 及 访问 者 模式 (Visitor)。 我 们 将 
详细 了 解 一 下 观察 者 模式 ， 甚 余 的 做 简单 介绍 。 如 需 完 整 而 准确 的 模式 规 艺 说 明 ， 请 参见 参 
风 文 献 [4]。 

观察 者 模式 解决 这 样 一 个 设计 辐 题 。 假设 某 个 应 用 程序 包含 一 个 重要 的 数据 结构 ,这 个 结构 
将 会 不 断 地 更 新 。 这 个 数据 结构 叫做 主体 (subject)。 在 主体 变化 的 时 候 ， 需 要 通知 另外 一 些 组 
件 。 这 些 组 件 被 称 之 为 观察 者 (observer)， 因 为 它们 时 刻 注意 着 主体 的 变化 。 有 一 点 非常 重要 ， 
那 束 是 观察 者 的 数量 是 未 知 的 : 它们 独立 运作 ， 可 以 来 去 目 如 。 这 意味 着 主体 和 观察 者 无 法 被 放 
到 一 个 单独 的 类 或 者 模块 中 去 。 也 就 是 说 ,主体 和 观 妈 者 之 间 必 须 有 一 个 动态 的 连接 。 对 于 这 个 
设计 问题 的 解决 方案 如 下 : 主体 和 观察 者 都 是 独立 的 对 象 ， 如 采 观 察 者 想 要 关注 某 个 主体 必须 在 
该 主体 处 注册 。 当 主体 变化 时 ， 它 会 传送 一 个 消息 或 者 提醒 给 所 有 注册 过 的 观察 者 。 我 们 可 以 把 
某 个 博客 和 对 这 个 博客 感 兴趣 的 读者 看 做 是 观察 者 模式 的 一 个 例子 。 读 者 不 必 一 直 不 停 地 刷新 这 
个 博客 ， 而 只 需 在 博客 处 注册 ,并 选择 在 新 的 博文 发 表 时 自动 收 到 提醒 〈 如 邮件 或 者 弹出 信息 )， 
然后 读者 可 以 自行 决定 什么 时 候 下 载 和 阅读 这 篇 新 的 文 草 。 

图 22-1 展 示 的 是 观察 者 模式 的 类 图 。 从 图 中 可 以 看 出 ， 主 体 和 观察 者 都 有 有 具体 的 子 类 ， 也 束 
是 说 在 使 用 的 时 候 ， 我 们 必须 根据 使 用 环境 对 其 进行 调整 。 观 察 者 类 提供 了 三 个 重要 的 方法 。 
attach 和 detach 方 法 用 于 注册 和 注销 观察 者 。notify 方 法 将 志 历 调用 每 个 已 注册 的 观察 者 类 
的 updaate 方 法 。 每 个 具体 的 观察 者 类 都 将 实现 目 己 版 本 的 update 方 法 。 每 个 update 方 法 都 会 
从 有 具体 的 主体 类 那里 获取 相关 的 数据 ,并 更 新 所 在 观察 者 类 的 相关 变量 。 这 个 模式 有 一 个 重要 特 
点 ， 那 就 是 观察 者 之 间 相 互 独立 〈 观 察 者 之 间 无 需 传递 数据 ) ， 但 是 只 要 主体 产生 变化 ， 那 么 所 
有 注册 过 的 观察 者 都 将 自动 更 新 。 

抽象 工厂 模式 ， 又 称 为 套件 〈kit) ， 是 一 种 用 于 创建 多 个 同类 对 象 的 方法 。 我 们 可 以 用 UI 工 
具 包 中 的 元 素 作 为 例子 ， 比 如 和 窗口、 按钮 、 深 动 条 、 图 标 等 。 在 UI 初始 化 之 后 ， 开 发 人 员 就 必须 
选择 符合 当前 平台 的 图 形 元 素 。 要 做 到 这 一 点 ,开发 人 员 可 以 使 用 一 个 工厂 类 来 生成 需要 的 元 素 。 
如 采 平 台 变 化 ,使 用 的 工厂 类 也 随 着 变化 。 所 有 这 些 工 厂 类 都 有 一 套 相 同 的 接口 ， 这 些 接 口 由 一 
个 抽象 类 定义 一 一 这 就 是 这 个 模式 名 字 的 来 历 。 这 个 模式 的 好 处 就 是 : 由 于 工厂 类 的 接口 是 固定 
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AY, 所 以 UI 只 需要 知道 怎么 选择 合适 的 工厂 类 ,这 些 工厂 类 就 可 以 被 分 别 独立 实现 ， 而 无 需 和 考虑 
实际 选择 的 是 哪 个 工厂 类 。 
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包 ， 而 且 他 们 想 要 从 堆 开 始 编写 这 些 UI 元 素 ,， 不 用 各 个 平台 的 原生 UI 元 素 。 要 想 将 这 些 元 素 画 出 
来 ， 就 需要 用 到 原始 的 绘图 操作 ， 比 如 绘制 直线 、 绘 制 文字 以 及 设置 颜色 等 。 在 桥 模式 下 ， 开 发 
人 员 将 把 这 些 原始 操作 全 部 整理 成 一 个 接口 , 然后 在 多 个 平台 上 实现 这 个 接口 。 当 初始 化 UI 工具 
包 的 时 候 , 程序 将 选择 适用 于 当前 平台 的 原始 操作 版本, 并 在 每 个 UI 元 素 中 都 保存 一 个 指 回 它 的 
指针 。 在 需要 绘制 按钮 或 者 窗口 的 时 候 ， 所 有 的 UI 元 素 都 会 通过 这 个 指针 来 调用 原始 绘图 操作 。 
这 个 指针 就 是 一 座 “ 桥 "， 用 于 连接 UI 元 素 和 针对 不 同 平台 的 原始 操作 。 

组 合 模式 用 于 建立 软件 部 件 之 则 的 层级 结构 。 电 脑 的 文件 系统 就 是 一 个 部 件 层级 结构 : 根 目 
杂 包 含 所 有 鸭 文件 和 目录 , 根 目录 下 的 目录 又 包含 其 他 的 一 些 文件 和 目录 , 等 圭 。 部 件 层级 机 构 
可 能 延伸 到 任意 的 深度 。 组 合 模式 提供 了 一 个 标准 化 的 方法 来 安排 这 些 层级 结构 。 它 把 层级 结构 
中 的 市 点 分 为 两 种 : 容 强 广 点 〈 即 我 们 例子 中 的 目录 )， 以 及 叶 市 点 ( 即 我 们 例子 中 的 文件 )。 叶 
TRA, 也 就 古 说 它们 无 法 包含 其 他 证 上 护 。 容 带 和 叶 市 皮 的 接口 将 提供 一 些 两 者 都 需要 的 
公用 操作 。 在 文件 系统 的 例子 中 , 共同 的 操作 有 重 命 名 、 移动 文件 或 目录 以 及 打开 文件 或 目录 等 。 

淡 饰 者 模式 的 作用 是 在 不 修改 已 有 类 的 情况 下 ， 为 其 附加 信息 或 者 功能 。 淡 饰 者 ”就 是 代 
松原 来 类 的 代理 。 只 要 沽 饰 者 类 收 到 消息 ， 它 就 会 执行 目 己 的 函数 ,再 把 需要 执行 的 工作 委托 给 
原来 的 类 执行 。 例 如 ,测试 淡 饰 者 类 可 以 在 测试 用 例 执 行 之 前 和 之 后 附加 代码 ,以 记录 测试 的 ID 
及 其 执行 结 末 。 

模板 方法 模式 用 于 创建 可 扩展 的 软件 。 模 板 方法 是 指 调用 其 他 辅助 函数 〈 即 所 谓 的 hooks ， 
“FEES” ) 的 大 型 国 数 。 挂 钧 国 数 是 抽象 的 ， 它 们 不 会 在 定义 模板 的 类 中 实现 。 模 板 方法 类 的 子 类 
必须 实现 这 些 挂钩 国 数 。 网 页 训 蝎 右 是 一 个 很 好 的 例子 。 训 览 右 提供 了 一 个 方法 来 播放 代 体 文件 ， 
但 是 这 个 方法 必须 可 以 扩展 来 文 持 其 他 厂商 的 未 知 格式 。 使 用 模板 方法 的 话 ， 训 览 奉 加 可 以 载 人 
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如 体 文件 , 但 古 使 用 挂 钓 函数 来 进行 播放 、 集 止 、 倒 进 操 作 。 这 些 挂 钓 函数 将 由 每 个 巡 体 类 型 对 
应 的 子 类 来 实现 。 模板 方法 将 处 理 媒 体 文件 的 所 有 组 织 层面 的 操作 , 但 是 当 需 要 播放 的 时 候 ， 它 
谍 会 将 播放 的 任务 交 给 适当 的 插件 ( 即 挂 钓 函数 ) 来 进行 。 

访问 者 模式 提供 了 一 套 方 法 来 过 历 递归 的 数据 结构 。 通 节 情 况 下 ,访问 者 模式 和 组 合 模式 是 
一 起 使 用 的 。 例 如 ， 文 件 系 统 的 访问 者 函数 可 以 人 过 历 整 个 目录 树 ， 以 计算 文件 和 目录 所 占用 的 空 
旧 。 还 有 的 访问 者 函数 可 能 会 从 文件 中 提取 关键 词 ， 并 进行 索引 ,以 便 快速 查找 包含 茶 个 关键 词 
的 文件 。 访问 者 模式 的 有 趣 之 处 在 于 , 这些 访 回 者 函数 并 不 是 像 人 们 想象 的 那样 内 萤 在 文件 系统 
的 类 中 。 实 际 上 ,访问 者 函数 可 以 独立 创建 并 随意 用 来 所 历 任何 一 个 递归 的 数据 结构 。 


22.2 为 什么 认为 设计 模式 可 行 


在 开始 试验 之 前 ， 我 们 应 该 先 构 想 一 个 解释 (或 者 理论 )， 即 为 什么 我 们 假定 的 现象 可 能 会 
发 生 。 如 东 我 们 襄 无 目的 地 比较 方法 A 和 B， 也 不 知道 他 们 之 间 为 什么 可 能 会 有 区 别 ， 融 很 难 设 
计 出 令 人 信服 的 实验 。 从 另 一 个 方面 来 说 ， 如 东 我 们 知道 有 哪些 可 能 的 原因 ， 就 可 以 顺 着 这 个 方 
问 来 设计 我 们 的 实验 ， 否 则 融 只 能 征 大 海 搞 针 了 。 此 外 ， 普 过 适用 性 也 存在 问题 : 我 们 只 能 宣称 
我 们 观 罕 到 的 区 别 存在 于 和 我 们 的 实验 环境 类 似 的 环境 中 。 对 于 想 要 了 解 理论 和 实验 之 间 的 相互 


依赖 关系 的 读者 , 我 们 强烈 推荐 Chalmers 的 书 《 科 学 是 个 什么 玩意 儿 ? 》(What Is This Thing Called 
(1] 








Science? ) 

那么 ， 到 底 途 什么 说 设计 模式 可 以 改善 程序 员 的 效率 、 软 件 的 质量 以 及 团队 的 沟通 ? “区 
块 理论 ”是 一 种 可 能 的 解释 。1956 年 ，George A. Miller 在 他 的 著名 论文 “神奇 数字 七 ， 加 减 一 ， 
我 们 在 信息 处 理 容 量 上 的 一 些 限制 ”(The Magical Number Seven, Plus or Minus Two; Some Limits 
on our Capacity for Processing Information) “。 他 的 理论 假设 人 类 的 记忆 包含 短期 和 长 期 两 种 。 
短期 记忆 快速 而 准确 ， 但 是 它 的 容量 有 限 ， 只 有 大 约 7 土 2 个 “区 块 "。 区 块 是 信息 的 存储 单位 。 
有 趣 的 是 ， 每 个 区 块 内 所 存储 的 信息 量 却 非 常 不 国定 。 而 长 期 记忆 拥有 巨大 的 容量 ， 但 是 要 想 
回忆 起 其 中 的 信息 相对 较 慢 而 且 有 时 较为 不 准确 。 要 想 在 长 期 记忆 中 存储 信息 ， 人 类 必须 不 断 
练习 ， 以 不 断 重 复 的 方式 来 记忆 。 短 期 记忆 无 需 练 习 ， 它 似乎 能 芝 不 费力 地 存储 信息 ， 但 是 记 
得 快 扎 得 也 快 。 在 思 芳 的 时 候 ， 人 类 主要 依赖 短期 记忆 ， 但 是 当 把 所 有 短期 记忆 都 用 完 之 后 ， 
他 们 就 会 使 用 长 期 记忆 ， 这 样 思 维 就 会 慢 下 来 。 比 如 ， 当 面 对 大 型 软件 的 时 候 ， 程 序 员 常 弟 需 
要 返回 重新 阅读 或 者 检查 他 们 已 经 解决 的 部 分 。 当 产生 “怎么 又 忘 了” 这样 的 问题 的 时 候 ， 很 
明显 短期 记忆 就 已 经 被 用 完了 ， 必 须要 再 练习 。 短 期 记忆 有 些 类 似 微 处 理 絮 的 缓存 ， 如 果 新 的 
信息 放 不 进来 ， 旧 的 信息 束 会 被 释放 挥 。 但 是 , 被 释放 挥 的 信息 并 不 会 日 动 储存 在 长 期 记忆 中 ， 
除非 它们 经 过 了 练习 。 

短期 记忆 的 七 个 区 块 限制 正 是 设计 模式 可 以 起 作用 的 地 方 : 这 些 模式 可 以 将 多 个 设计 元 素 组 
合成 一 个 存储 单位 。 举 例 来 说 ， 如 果 不 使 用 观察 者 模式 ， 程 序 员 需 要 在 短期 记忆 中 存储 4 个 独立 
的 类 ， 加 上 它们 之 间 注 册 和 更 新 的 协议 ， 这样 就 用 挥 了 不 少 记 忆 空 间 。 但是， 如 果 程 序 员 使 用 观 
察 者 模式 ， 那 么 他 就 只 需要 一 个 记忆 区 块 ， 这样 束 腾 出 了 不 少 记忆 空间 来 解决 其 他 的 设计 问题 。 
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软件 的 设计 第 第 会 包括 很 多 的 类 , 所 以 这 样 把 各 个 类 放 到 一 个 区 块 中 进行 记忆 的 方法 可 能 会 起 到 
一 定 的 效 末 。 程序 的 文档 还 可 以 直接 写 明 使 用 的 设计 模式 ， 并 告知 相应 的 类 ,这样 束 可 以 帮助 读 
者 把 信息 进行 分 区 。 比 如 ， 如 来 文档 写 明 ,使 用 的 是 观察 者 模式 ,程序 员 就 可 以 很 快 地 对 这 些 类 
有 一 个 大 概 的 认识 ,其 至 不 需要 专门 去 看 注册 和 更 新 的 代码 。 从 本 质 上 说 , 设计 模式 利用 了 更 多 
的 程序 员 的 短期 记忆 ， 使 得 存储 更 完整 ， 思 考 的 过 程 更 快 、 更 全 面 也 更 准确 。 这 也 正 征 设计 模式 
宣称 能 提高 程序 员 效 率 和 软件 质量 的 原因 。 团 队 的 沟通 也 可 能 得 到 改善 。 举 例 来 说 ,在 使 用 设计 
模式 之 后 , 程序 员 们 就 不 必 长 驴 大 论 地 告诉 其 他 人 哪儿 个 对 象 如 何 注 册 以 及 获知 更 新 等 , 而 古 只 
需要 说 哪儿 个 类 组 成 了 观察 者 模式 就 可 以 了 ， 无 需 多 言 。 看 来 ， 专 门 的 术语 确实 有 它 的 优势 啊 1 

不 过 这 些 还 只 是 推测 , 没 人 知道 设计 模式 到 底 能 不 能 真 的 种 来 这 么 多 好 处 , 但 是 至 少 区 块 理 
论 可 以 帮助 我 们 设计 合适 的 实验 。 这 些 实验 将 用 于 神 试 程序 员 在 使 用 设计 模式 中 的 类 和 各 类 软件 
元 素 时 的 效率 。 实 验 中 的 任务 必须 足够 大 ， 这 样 才能 让 程序 员 们 无 法 完全 利用 短期 记忆 来 工作 ， 
但 是 也 不 能 过 于 庞大 。 我 们 认为 设计 模式 的 好 处 主要 可 能 来 自 于 以 下 两 后: 设计 模式 可 以 让 程序 
员 更 准确 地 了 解 软 件 的 结构 ， 或 者 设计 模式 帮助 开发 者 腾 出 了 一 些 短期 记忆 的 空间 来 做 其 他 事 
情 。 由 于 短期 记忆 的 实际 使 用 量 难以 确定 ， 所 以 我 们 的 实验 将 主要 关注 前 一 反 。 
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我 们 需要 回答 的 第 一 个 问题 是 : 仪 仅 使 用 设计 模式 文档 是 否 就 能 提高 程序 员 的 效率 ?我 们 的 
想法 是 ,让 两 组 程序 员 对 同一 个 程序 进行 修改 ,其 中 一 组 的 文档 中 包含 现在 使 用 的 设计 模式 信息 ， 
而 男 一 组 则 使 用 没有 设计 模式 信息 的 普通 文档 。 也 束 古 说 , 这 个 实验 测试 鸭 古 设计 模式 文档 有 鸭 影 
| 啊 ， 而 不 是 模式 本 里 的 效 末 。 我们 在 1996 年 设计 这 个 实验 的 时 候选 择 了 这 种 方式 ， 因 为 当时 我 们 
尚未 找 出 一 种 方法 可 以 为 一 个 程序 设计 两 个 相同 而 又 具备 可 比 性 的 版 本 , 即 一 个 包含 设计 模式 ， 
另 一 个 不 包含 。 不 过 在 后 来 的 一 次 实验 中 我 们 解决 了 这 个 问题 。 无 论 如 何 ， 就 算 只 测试 设计 模 
式 文档 也 还 是 有 意义 的 ， 因 为 它 可 以 让 我 们 初步 确认 设计 模式 是 否 可 能 有 效 。 如 来 单单 在 文档 
中 包含 设计 模式 信息 就 能 够 提升 效率 ， 那 么 可 以 想象 ， 使 用 和 不 使 用 设计 模式 的 程序 之 间 的 区 
别 会 更 大 。 








22.3.1 实验 的 设计 

我 们 想 要 用 实验 来 回答 的 具体 问题 是 这 样 的 : 相 比 起 没有 任何 设计 模式 信息 的 代码 , 包含 了 
明确 的 设计 模式 广 释 的 代码 是 否 更 能 够 帮助 开发 人 员 进 行 维护 工作 ? 我 们 把 这 个 问题 分 为 两 个 
假说 。 


e O01 
设计 模式 文档 加 快 了 其 所 对 应 的 维护 任务 的 进度 
e U2 


设计 模式 文档 减少 了 其 所 对 应 的 维护 任务 中 的 错误 
实验 将 记录 程序 员 在 执行 设计 模式 所 对 应 的 维护 任务 时 所 花 的 时 间 和 发 生 的 错误 。 实 际 上 ， 
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我 们 进行 了 两 次 实验 。 第 一 次 实验 是 1997 年 1 月 在 德国 卡尔 斯 鲁 厄 大 学 (下 称 UKA) 进行 的 ， 而 
第 二 次 实验 是 1997 年 5 月 在 圣路易斯 华盛顿 大 学 〈( 下 称 WUSTL) 进行 的 。 在 UKA，64 个 研究 生 和 
10 个 本 科 生 参与 了 实验 ; 在 圣路易斯 , 22 个 本 科 生 参与 了 实验 。 所 有 的 学 生 都 参加 了 Java (UKA) 
或 者 C++ (WUSTL) 的 培训 ， 并 在 实验 之 前 都 已 经 使 用 设计 模式 写 过 程序 。 我 们 在 正式 实验 之 
前 让 所 有 参与 者 先 参 加 了 一 次 测试 ,以 确保 他 们 了 解 实验 相关 的 设计 模式 。 详 细 的 过 程 请 参见 参 
考 文 献 [10]。 

党 第 有 人 会 提出 异议 ,说 我 们 应 该 找 专业 人 士 而 不 古 学 生来 参与 实验 。 但 古 ， 在 那个 时 候 设 
计 模式 刚刚 起 步 不 入， 有 相关 经 验 的 专业 人 士 非 第 难 找 。 不 过 ， 即 便 实 验 的 对 象 是 学 生 ， 我 们 的 
实验 也 仍然 是 有 效 的 。 如 来 用 不 用 设计 模式 对 学 生来 说 没什么 区 别 , 那么 对 于 专业 人 士 来 说 设计 
模式 估计 也 不 能 市 来 什么 好 处 。 造 成 这 种 情况 的 原因 有 几 个 : 首先 ， 专业 人 士 有 着 与 大 型 系统 打 
交道 的 经 验 ， 所 以 他 们 可 能 不 太 需 要 设计 模式 的 帮助 ， 这样 就 会 降低 设计 模式 的 真实 效 末 ， 让 使 
用 和 使 用 设计 模式 的 区 别 不 那么 明显 ; 其 次 ,专业 人 士 的 痛 景 更 复杂 ,他 们 中 很 多 并 没有 经 过 计 
算 机 科学 专业 的 正规 培训 ,而 且 他 们 的 经 验 也 从 几 年 到 几 十 年 不 等 。 与 此 相反 ,在 大 学 学 习 计 算 
机 科学 的 学 生 大 都 同时 阅读 同样 的 材料 ， 而 且 他 们 的 编程 经 验 也 比较 一 致 。 也 融 是 说 ， 如 末 用 专 
业 人 士 作为 实验 对 象 ,那么 数据 中 的 干扰 将 会 非常 多 ， 而 数据 干扰 的 增多 加 上 获 采 的 降低 就 意味 
着 我 们 将 难以 发 完 那 些 不 那么 明显 的 差别 。 如 琳 是 这 样 的 话 , 我 们 就 不 能 用 专业 人 士 作为 实验 对 
象 ， 因 为 结 采 将 是 不 确定 的 。 我 们 对 学 生 做 的 实验 可 以 被 看 做 是 一 个 急 步 实验 ， 人 研究 人 员 可 以 据 
此 来 判断 假说 在 专业 人 士 导 上 推广 的 可 能 性 。 

虽然 两 次 实验 是 相似 的 ， 但 同时 也 有 一 些小 小 的 不 同 ， 这 使 得 它们 相互 之 间 更 为 互补 。 在 
UKA, 学 生 们 使 用 Java 语 言 来 把 答案 写 在 纸 上 , 而 在 WUSTL 的 学 生 们 用 C++ 来 在 电脑 上 写 可 以 运 
行 的 程序 。 在 纸 上 写 答案 可 以 避免 很 多 和 实验 问题 无 天 的 影响 ， 比 如 使 用 编程 环境 或 者 程序 语言 
的 困难 等 。 而 在 电脑 上 写 可 以 运行 的 程序 可 以 更 确切 地 证 明 程序 员 们 真正 理解 了 设计 模式 。 对 两 
次 实验 结 东 的 比较 让 我 们 得 出 了 一 个 结论 ， 那 束 是 在 以 后 的 实验 中 只 用 在 纸 上 写 的 方式 其 实 就 足 
够 了 。 此 外 ， 使 用 两 种 不 同 的 面 癌 对 象 的 语言 让 我 们 可 以 说 我 们 的 结论 并 不 只 起 基于 菏 一 种 语言 。 

这 两 次 实验 都 在 期 末 的 时 候 进 行 ， 代 蔡 期 末 考 试 。 实 验 的 长 度 在 2 到 4 小 时 之 间 ， 但 古 很 多 
WUSTL 的 学 生 提 前 放弃 了 ， 因 为 他 们 想 要 在 期 末 考 试 之 后 乘 车 回 家 。 科 学 实验 也 是 在 现实 世界 
中 进行 的 ， 而 现实 世界 的 事情 往往 会 对 实验 产生 计划 之 外 的 影响 ，WUSIL 的 例子 就 是 由 于 对 此 
认识 不 足 而 付出 的 代价 。 

由 于 我 们 预 驳 已 经 知道 只 有 为 数 不 多 的 参与 者 , 我 们 决定 让 每 个 参与 者 允 使 用 市 有 设计 借 却 
的 文档 进行 一 次 任务 ， 再 使 用 不 市 文档 的 进行 一 次 。 这 样 ， 我 们 束 能 从 每 个 参与 者 身上 得 到 两 个 
数据 。 显 然 ， 让 参与 者 重复 执行 同样 的 维护 任务 两 次 的 做 法 不 是 很 好 ， 所 以 ， 我 们 需要 两 个 在 规 
模 和 复杂 度 上 都 差不多 的 程序 。 由 于 我 们 要 将 两 个 程序 的 实验 数据 结合 起 来 ,它们 的 复杂 度 不 能 
兰 别 大 延 ， 因 为 如 本 差 得 大 延 那么 我 们 就 很 难 分 辩 区 别 到 搬 赴 由 设计 模式 造成 的 ， 还 征 规模 和 复 
杂 度 的 不 同 造成 的 。 第 一 个 程序 是 电话 泗 。 这 个 程序 包含 一 个 地 址 数据 库 ， 然 后 可 以 按 多 种 格式 
来 显示 姓名 和 电话 号 码 。 它 由 11 个 类 和 565 行 代码 组 成 ， 其 中 197 行 古 注释 。 电 话 禾 使 用 了 观察 者 
和 模板 方法 两 种 设计 模式 。 第 二 个 程序 实现 了 一 个 与 或 树 (And-Or-Tree), 一 种 递归 的 数据 结构 。 
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它 包 括 7 个 类 和 362 行 代码 ， 其 中 133 行 古 注 释 。 这 个 程序 较 短 一 些 ， 但 是 也 更 难 理解 。 它 使 用 了 
组 合 模 式 和 访问 者 两 个 设计 模式 。 为 了 体现 设计 模式 信息 , 我 们 在 电话 短程 序 的 代码 中 增加 了 14 
HERE, 在 与 或 树 的 代码 中 增加 了 18 行 代码 。( 此 处 的 行 数 是 Java 版 本 的 行 数 ，C++ 版 本 的 行 数 稍 
有 不 同 。) 下 面 是 我 们 添加 的 注释 的 例子 : 

xxx 设计 模式 : *** 注册 两 个 TupleDisplays 为 Tupleset 的 观察 者 。 

xxx 设计 模式 : *** newTuple 和 它 的 辅助 方法 mergeIn () 组 成 一 个 *** 模板 方法 *xx。 挂 
钓 方法 分 别 是 select(), format() 和 compare () 。 

需要 注意 的 是 ， 即 便 没 有 这 些 设计 模式 信息 ， 这些 程序 也 还 是 有 完备 的 文档 的 。 就 算 没 有 这 
些 额外 的 提示 信息 ,维护 任务 也 是 完全 可 行 的 。 也 就 是 说 ， 实 验 的 设计 极为 保守 ， 把 设计 模式 信 
电 的 彩 啊 减 到 低 得 不 能 再 低 的 程度 。 如 东 我 们 能 用 这 样 的 实验 条 件 证 明 议 计 模式 可 以 减少 错误 或 
者 工作 时 间 的 话 ， 那 么 这 些 改善 在 真实 的 程序 中 可 能 会 更 明显 ， 因 为 那些 所 谓 “ 专 业 “” 的 程序 往 
往 没 有 这 么 完备 的 文档 。 

对 于 电话 禾 来 说 ,维护 任务 包括 声明 并 实例 化 两 个 新 的 观察 者 类 , 一 个 有 模板 方法 , 一 个 没 
有 。 对 于 与 或 树 来 说 ,参与 者 需要 声明 并 实例 化 一 个 新 的 访问 者 类 。 维 护 任 务 的 说 明 并 没有 提 到 
设计 模式 .。 

由 于 两 个 程序 是 不 同 的 , 所 以 我 们 必须 解决 研究 的 有 效 性 的 问题 。 如 果 在 第 一 次 实验 中 得 到 
了 模式 信息 的 参与 者 在 第 二 次 实验 中 自己 去 寻找 模式 怎么 办 ?那么 第 二 次 实验 的 数据 就 无 效 了 ， 
因为 如 果 参 与 者 自己 去 寻找 模式 ,那么 他 们 的 行为 就 会 和 有 模式 信息 时 一 样 。 对 电话 禾 程 序 来 说 
也 是 一 样 ， 参与 者 有 可 能 从 中 了 解 到 一 些 模式 信息 ， 然 后 应 用 到 男 一 个 的 程序 中 。 这 种 有 效 性 的 
问题 被 称 为 顺序 问题 或 者 学 习 效 应 。 我 们 解决 这 个 同 题 的 办 法 是 使 用 制衡 性 实验 设计 : 我 们 将 参 
与 者 分 为 四 组 ， 每 组 收 到 任务 的 顺序 ， 以 及 这 些 任务 是 否 带 设计 模式 文档 的 顺序 都 不 同 。 

图 22-2 展 示 的 是 制衡 性 实验 设计 的 详情 。 比 如 说 ， 第 1 组 先 处 理 有 模 却 文档 的 电话 得 程序 ， 
然后 再 处 理 没 有 模式 文档 的 与 或 树 程序 。 通 过 交 又 对 比 结果 , 我 们 就 可 以 检查 模式 文档 是 否 造 成 
了 起 步 上 的 差 中 。 比 如 ， 第 1 组 和 第 4 组 都 处 理 了 带 模 式 文档 的 电话 短程 序 ， 但 是 先后 顺序 不 同 ; 
第 2 组 和 第 3 组 也 用 同样 的 方式 处 理 了 与 或 树 。 研究 人 员 将 检查 左边 圆圈 ( 即 有 模式 文档 ) 和 右边 
圆圈 的 实验 结 东 的 区 别 。 如 朱 确 有 很 大 不 同 ， 那 么 我 们 束 可 以 说 存在 学 习 效 应 。 同 样 的 ， 我 们 也 
可 以 对 没有 模式 文档 的 奏 形 也 做 同样 的 比较 ,， 找 出 它们 之 间 是 否 也 有 学 习 效 应 。 在 我 们 的 实验 中 
没有 发 现 学 习 效 应 。( 为 了 更 安心 ， 我 们 又 在 实验 后 的 调查 问卷 中 加 参与 者 有 没有 上 自己 去 找 设计 
模式 ， 结 末 是 大 家 都 没有 。) 由 于 没有 发 现 学 习 效 应 ， 那 么 我 们 就 可 以 直接 对 比 圆圈 和 疤 形 的 实 
验 结 末 ， 而 无 需 对 学 习 效 应 进行 修正 。 




















22.3.2 ”研究 结果 

我 们 对 参与 者 们 提交 上 来 的 答案 评 了 分 ， 并 计算 了 分 配 和 完成 任务 之 间 的 时 间 (精确 到 分 
钟 )。 此 外 ， 我 们 还 计算 了 完全 正确 的 答案 的 数量 。 我 们 发 现 评 分 并 疫 有 表现 出 明显 的 差异 ， 所 
以 只 对 比 了 时 间 和 完全 正确 的 答案 的 数量 。 下 面 这 个 表 展 示 了 与 或 树 的 结 末 。 
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有 模式 文档 无 模式 文档 显著 性 〈p 值 ) 
UKA， 与 或 树 
正确 答案 15/38 7/36 0.077 
花费 时 间 ， 平 均值 58.0 52.2 0.094 
7 个 最 佳 答案 的 人 花费 时 间 ， 平 均值 38.6 45.4 0.13 
WUSTL， 与 或 树 
正确 答案 4/8 3/8 
花费 时 间 ， 平 均值 52.1 67.5 0.046 





C) 有 模式 文档 <> 没有 模式 文档 


图 22-2 ”模式 文档 实验 的 制衡 设计 (PH= 电 话 短 ，AOT= 与 或 树 ) 


关于 这 个 表 , 有 儿 扣 需要 注意 。 首 先 , 在 设计 模式 文档 的 帮助 下 ，UKA 的 参与 者 们 提交 的 完 

全 正确 的 答案 数量 增加 了 一 倍 〈15 比 7， 总 数 36) ， 这 个 效 采 很 可 观 。WUSTL 的 差距 稍 小 一 些 。 
让 人 意外 的 是 ， 有 了 模式 文档 之 后 UKA 的 学 生平 均 花 费 的 时 间 居 然 更 长 了 (58 比 52 分 钟 )。 不 过 ， 
这 个 看 法 有 误导 的 成 分 ,因为 没有 模 却 文档 信息 的 那 一 组 的 正确 率 要 低 很 多 。 这 里 需要 注意 的 是 
UKA 的 答案 是 写 在 纸 上 的 。 在 真实 的 维护 工作 中 , 错误 的 答案 可 能 会 被 检查 到 并 被 改正 ,这样 就 
会 需要 更 多 的 时 间 。 在 纸 上 写 的 方式 让 参与 者 们 很 难 检查 自己 的 答案 ， 所 以 我 们 在 这 次 实验 中 并 
没有 观察 到 多 伦 的 时 间 。 很 明显 , 对 比 在 错误 的 事情 上 人 花 的 时 间 和 在 正确 的 事情 上 人 花 的 时 间 和 起 没 
意义 的 。 所 以 ， 我 们 把 实验 数据 精简 了 : 由 于 没有 模式 文档 信息 的 小 组 只 提交 了 7 个 正确 的 答 
R, 我 们 就 把 这 7 个 正确 答案 所 伦 的 时 间 和 对 照 组 中 最 好 的 7 个 答案 所 花 的 时 间 进 行 对 比 。 结 东 征 
有 模式 文档 信息 的 组 花 的 时 间 少 一 些 ， 不 过 显 赦 性 不 高 。WUSIL 组 时 间 差别 的 p 值 小 于 0.05， 这 
可 能 是 因为 这 一 组 不 只 议 计 ， 而 且 还 测试 并 改正 了 他 们 的 答案 ， 所 以 结 朱 更 平均 一 些 。 通 过 比较 
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工作 时 间 和 答案 质量 ， 我 们 还 发 现 ， 在 没有 模式 文档 的 情况 下 ， 速 度 较 慢 〈 能 力 稍 差 ) 一 些 的 参 
与 者 提交 的 答案 质量 非常 低 ， 而 对 于 有 模式 文档 的 小 组 来 说 ， 质 量 和 所 需 的 时 间 疫 有 关联 。 

以 上 关于 时 间 和 正确 度 的 讨论 让 实验 设计 中 的 一 个 缺陷 浮现 了 出 来 , ADE AS EB Wa 
和 效率 具有 相互 依赖 性 。 很 明显 ， 要 提高 质量 需要 时 间 ， 所 以 化 费 更 多 的 时 间 并 不 意味 着 设计 模 
式 没 有 价值 。 也 就 是 说 ， 只 有 当 答 案 的 质量 相同 时 再 比较 时 间 才 有 意义 。 我 们 解决 这 个 问题 的 方 
法 征 只 对 比 正确 的 答案 ,但 十 这 就 让 我 们 损失 了 一 半 的 数据 和 统计 显著 性 。 吃 一 和 素 长 一 智 ， 其 实 
我 们 可 以 在 提交 时 做 一 次 验收 济 试 ， 确保 所 有 管 案 的 正确 性 ,就 能 解决 这 个 同 题 。 关 于 这 个 技巧 
我 们 将 在 结论 部 分 再 做 介绍 。 

总 的 来 说 ,与 或 树 代码 中 的 模式 文档 证 省 了 一 部 分 维护 时 间 ， 并 促成 了 更 好 的 解决 方案 ， 基 
至 能 力 稍 差 一 些 的 程序 员 也 可 以 写 出 较 好 的 解决 方案 。 而 对 于 电话 短 来 说 ， 结 条 (未 在 本 文中 展 
示 ) 也 表明 模式 文档 可 以 节省 时 间 , 但 是 没有 关于 质量 的 结 末 , 因为 数据 不 足 (部 分 学 生 走 掉 了 )。 

我 们 的 结论 是 如 琳 需 要 维护 的 程序 使 用 了 设计 模式 , 那么 在 代码 中 包含 模式 相关 的 文档 就 有 
可 能 减少 执行 程序 修改 所 需 的 时 间 ， 而 且 还 有 可 能 改善 修改 的 质量 。 所 以 ,我 们 建议 在 源 代 码 中 
一 定 要 加 入 设计 模式 信息 。 如 前 所 述 ， 我 们 这 次 实验 并 没有 测试 有 疫 有 设计 模 却 的 区 别 ， 只 测试 
了 有 没有 模式 文档 的 区 别 。 不 过 ， 实 验 结 琳 令 人 兴奋 ， 所 以 我 们 开始 准备 第 二 次 实验 。 这 次 ,我 
们 将 回答 设计 模式 有 没有 用 这 个 问题 ， 并 使 用 专业 人 士 作为 我 们 的 实验 对 象 。 
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党 二 个 实验 是 以 一 种 出 人 意料 的 方式 开始 的 。1997 年 的 时 候 ，sd&m 公 司 在 德国 法 兰 殉 福 附 
近 举 办 了 一 次 技术 会 议 , 我 是 受 吉 发 表演 讲 的 人 之 一 。 我 的 演讲 主题 是 设计 模式 ， 包 括 我 们 早 前 
关于 模式 文档 的 实验 结果 ,以 及 测试 设计 模式 实际 效果 的 重要 性 。 最 后 ,我 谈 到 正在 为 新 的 实验 
寻找 参与 者 , 作为 参与 的 回报 , 我 将 提供 设计 模式 的 强化 课程 , 并 介绍 当时 已 知 的 主要 设计 模式 。 
此 时 ，sd&m 公 司 的 创始 人 兼 总 裁 Ernst Denert 下 好 坐 在 前 排 。 我 说 完 之 后 ， 他 站 了 起 来 ， 走 到 讲 
RE, FURE WAM. 然后 怎样 呢 ? 演讲 之 后 确实 是 有 问答 时 间 , 但 是 也 不 能 抢 演 讲 者 话 简 吧 。 
然后 ， 他 转 癌 了 他 的 员工 〈 在 场 的 大 概 有 150 人 ， 大 部 分 是 开发 人 员 ) ， 说 道 :“ 你 们 都 听 到 Tichy 
zdziw TITA. RITARI, Wi, EAS? ” 几 秒 钟 的 沉默 之 后 ， 突 然 很 多 手 举 了 起 
来 ! 我 从 来 没 见 过 更 有 效 的 实验 动员 了 ， 从 来 设 有 。 在 经 过 了 各 种 准备 并 处 理 了 时 间 安 排 上 的 名 
突 之 后 ， 共 有 29 名 来 目 sd&m 的 专业 开发 人 员 参 与 了 我 们 的 实验 。1997 年 11 月 ， 实 验 在 sd&m 的 莫 
JETP But 

我 们 希望 用 实证 研究 的 方式 确定 设计 模式 是 否 能 带 来 好 处 , 以 及 是 不 是 模式 也 有 好 用 难 用 之 
分 。 尤 其 是 ,我 们 曾经 发 现 有 的 开发 人 员 对 于 设计 模式 过 于 狂热 ， 以 至 于 在 使 用 简单 的 方法 就 能 
解决 问题 的 时 候 他 们 也 会 使 用 设计 模式 。 这 样 的 矫 枉 过 正 会 不 会 造成 问题 ? 按 大 脑 区 块 理论 来 说 
的 话 ， 就 不 会 ， 因 为 单个 区 块 的 容量 并 不 重要 。 

不 过 ， 只 有 让 程序 员 们 修改 两 个 程序 ， 一 个 使 用 设计 模式 而 另 一 个 不 用 ， 再 做 对 比 ， 才 能 找 
出 真正 的 答案 。 
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和 之 前 一 样 ,这 个 实验 也 是 调查 在 不 同 设计 模式 下 的 软件 维护 工作 。 不 过 这 次 我 们 的 实验 对 
象 是 专业 人 士 。 这 次 实验 的 结构 和 前 一 个 类 似 ， 只 是 在 强化 课程 前 后 分 别 进行 了 两 次 实验 ， 共 花 
了 两 个 整 天 。 在 第 1 天 早上 ， 我 们 进行 了 一 次 课程 前 的 实验 ， 和 希望 能 评 佑 在 不 了 解 设 计 模式 的 情 
沈 下 ,开发 人 员 的 效率 如 何 。 在 第 1 天 下 午 和 第 2 天 早上 , 开发 人 员 们 参加 了 一 次 设计 模 却 的 强化 
课程 ， 然 后 第 2 天 下 午 进 行 了 一 次 学 习 后 的 实验 。 参 与 者 包括 29 个 专业 程序 员 ， 工 作 的 时 间 平 均 
是 4.1 年 。 参 与 者 们 仍然 使 用 纸 笔 , 虽然 不 限时 间 ， 但 他 们 都 在 三 小 时 内 提交 了 解决 方案 。 实 验 
中 他 们 需要 对 4 个 程序 进行 维护 ， 每 个 程序 都 有 两 个 版 本 : 一 个 设计 模式 版 ， 包 含 一 到 两 个 设计 
模式 ， 以 及 另 一 个 功能 相当 的 版 本 ， 使 用 了 比较 简单 的 结构 。 开 发 人 员 在 两 次 实验 中 分 别 对 设计 
模式 版 和 普通 版 进行 维护 。 两 次 实验 分 别 在 培训 前 后 进行 , 这 样 我 们 就 能 知道 关于 设计 模式 的 知 
识 会 不 会 提升 效率 ， 也 可 以 看 出 哪些 模式 在 没有 专门 学 习 过 的 情况 下 比较 容易 向 握 。 

图 22-3 概 括 了 实验 的 设计 。 为 了 解决 学 习 效 应 的 问题 以 及 疲 寡 珊 来 的 影响 ， 我 们 调整 了 程序 
的 顺序 〈 即 采取 了 制衡 性 设计 )。Pat 代 表 模 式 版 本 ，Alt 代 表 普 通 版 本 。ST、GR、CO、BO 代 表 
各 个 程序 。F 代 表 熟 悉 期 ， 在 这 个 时 间 段 我 们 问 参 与 者 介绍 实验 的 流程 。 














图 22-3 ”实验 设计 : 圆圈 代表 设计 模式 版 ， 识 色 的 委 形 代表 普通 版 本 。 双 字母 代码 是 
程序 名 的 缩写 。 时 间 从 左 到 右 进行 

不 同 的 模式 得 出 了 不 同 的 结果 。 图 22-4 展 示 的 是 参与 者 们 在 维护 ST 程序 〈 使 用 观察 者 模式 ) 
时 所 用 的 时 间 。4 个 盒 状 图 展示 的 是 修 改 时 间 的 分 布 情况 。 有 350% 的 数据 处 于 沙漏 形状 之 内 ， 数 
据 的 中 间 值 位 于 沙漏 的 中 央 。 左 边 是 学 习 之 前 的 测试 结 未 。 此 时 ， 修 改 设计 模式 版 比 修改 善 通 版 
本 〈 模块 版 ) 人 花费 了 更 多 的 时 间 。 显 然 ， 未知 的 模式 带 来 了 额外 的 复杂 性 ， 让 开发 人 员 人 花费 了 
更 多 的 时 间 。 不 过 , 在 经 过 了 设计 模式 培训 之 后 ,情况 就 有 了 改变 。 普 通 版 所 花费 的 时 间 和 培训 
前 大 致 持平 , 虽然 实际 上 设计 模式 的 版 本 更 复杂 , 但 古 花 费时 间 却 更 少 。 这 种 情况 正好 符合 我 们 
根据 大 脑 区 块 理论 所 做 的 设想 。 

图 22-5 展 示 的 是 效 饰 者 模式 的 相关 时 间 消 耗 。 很 明显 , 使 用 设计 模式 省 了 不 少 的 时 间 。 然而 ， 
还 有 一 个 惊喜 :培训 前 和 培训 后 的 结 来 没有 区 别 ! 显 然 即 便 古 在 程序 员 没 有 专门 进行 学 习 的 情况 下 ， 
钱 饰 者 模式 也 很 容 多 千 担 和 修改 。 也 束 征 说 ， 参 与 者 们 无 需 预先 将 装饰 者 模式 放 入 记忆 区 块 中 。 
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图 22-4 ”观察 者 模式 的 时 间 花 费 对 比 

不 过 ,并 不 是 所 有 的 实验 结 末 都 表明 了 这 一 点 。 例 如 ,组合 模 式 和 抽象 工厂 的 两 个 版 本 在 培 
训 前 后 的 实验 结 末 都 没什么 区 . 别 , 而 访问 者 模式 给 参与 者 们 币 来 了 很 大 的 困扰 。 在 培训 前 的 实验 
中 ， 普 通 版 需要 的 时 间 比 访问 者 模式 版 的 要 多 ,但 是 在 培训 之 后 ,情况 却 反 了 过 来 。 很 明显 , 在 
培训 课程 中 讲解 访问 者 模式 的 时 间 相 对 较 少 ， 所 以 参与 者 们 没 能 完全 理解 。 总 的 来 说 ,一 共有 9 
个 维护 任务 。 在 大 多 数 的 任务 中 ,我 们 都 发 现 了 设计 模式 的 积极 效 末 : 要 么 因为 设计 模式 所 具备 
的 灵活 性 免除 了 额外 的 维护 时 间 ， 要 么 维护 的 时 间 相 对 于 普通 版 本 有 所 减少 。 在 少数 几 个 任务 中 
我 们 发 现 了 人 负面 的 效 末 : 普通 版 本 的 解决 方案 较 不 容易 出 错 ， 或 者 需要 的 维护 时 间 更 少 。 换 句 话 
说 ,不 是 所 有 的 设计 模式 邦 古 同样 地 好 。 如 琳 想 获取 各 个 维护 任务 的 详细 信息 , 请 参见 参考 文献 [8]。 

2002 年 ， 我 们 在 挪威 的 Simula 实 验 室 扩 展 并 重复 了 这 次 实验 。 我 们 使 用 了 同样 的 程序 和 维护 
任务 ,其 至 连 培 训 课 程 和 材料 都 完 全 相同 。 但 是 ,不 使 用 纸 笔 , 而 是 使 用 实际 的 编程 环境 让 我 们 
的 实验 更 加 真实 。 共 雇佣 了 44 位 来 目 各 个 大 型 II 咨询 公司 的 专业 人 士 参 与 了 这 次 实验 。 我 们 用 回 
归 模 型 分 析 了 消耗 的 时 间 和 答案 的 正确 性 。 我 们 还 在 线 记 录 了 参与 者 的 工作 情况 ,让 我 们 可 以 更 
好 地 了 解 这 些 结 末 。 数据 非 第 清楚 地 表明 了 设计 模式 有 好 用 和 不 好 用 之 分 。 观 察 者 和 小 饰 者 模式 
韭 第 易于 告 握 和 使 用 ,其 至 对 于 几乎 没什么 模式 知识 的 参与 者 来 说 也 是 如 此 。 访问 者 模式 再 次 造 
成 了 困扰 。 这 次 实验 证 实 了 早 前 实验 的 结 末 。 这 一 点 非 第 重要 ， 因 为 这 次 我 们 不 古 在 纸上谈兵 ， 
而 是 实际 进行 了 编程 。 此 外 ,参与 者 的 专业 背景 差别 巨大 (从 1 年 以 下 到 20 年 以 上 )， 所 以 这 次 的 
结 霖 更 具备 普遍 性 。 

这 些 结果 的 意义 是 : 我 们 不 能 简单 地 说 设计 模式 是 好 还 是 坏 , 还 必须 旁 虑 模式 是 否 适合 想 要 
解决 的 问题 ,以 及 程序 员 是 人 否 能 理解 这 个 模式 。 当 程序 的 代码 中 包含 了 模式 的 信息 时 ， 就算 十 短 
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期 的 培训 也 可 以 提升 维护 工作 的 效率 和 质量 。 当 我 们 在 犹 移 是 否 选 择 设计 模式 的 时 候 , 不 妨 考 虑 
一 下 软件 开发 中 随时 可 能 出 现 的 新 需求 ， 那 时 设计 模式 所 具备 的 高 灵活 性 就 可 以 帮 上 忙 。 


CC 程序 
RMA 


测试 前 测试 后 


时 间 (分 钟 ) 





模块 模式 模块 模式 
图 22-5” 污 饰 者 模式 的 相关 结 末 


22.5 ”第 三 个 试验 : 设计 模式 之 于 团队 沟通 


关于 设计 模式 的 第 三 个 大 的 假设 是 它 能 改善 团队 的 沟通 。 我 们 第 三 次 实验 的 目标 , 是 测试 一 
般 性 的 模式 知识 能 不 能 为 团队 成 员 市 来 更 有 效 的 沟通 。 很 明显 ,要 想 检验 这 个 假设 是 否 正 确 ， 除 
了 直接 观 罕 团 队 成 员 之 间 的 沟通 别 无 他 法 ,难点 在 于 如 何 让 他 们 沟通 ,以 及 如 何 评 佑 沟通 的 成 效 。 
目 言 自 语 或 者 直接 和 观 侍 员 谈话 对 于 团队 成 员 来 说 是 不 目 然 的 , 所 以 我 们 决定 将 参与 者 们 分 为 一 
个 个 的 三 人 小 组 ， 并 在 他 们 执行 设计 维护 任务 的 时 候 记 录 他 们 之 间 的 交流 (包括 音频 和 视频 )， 
然后 再 分 析 这 些 录 音 和 录像 。 

实验 的 设置 如 下 。 每 一 组 参与 者 邦 将 执行 一 个 设计 维护 任务 。 我 们 会 预先 给 其 中 一 个 参与 者 
额外 的 一 些 时 间 ， 作 为 诱导 解释 阶段 的 准备 。 在 这 段 时 间 内 ,该 参与 者 将 研究 需求 以 及 程序 的 设 
计 文 档 。 我 们 称 这 个 组 员 为 专家 。 我 们 没有 限制 准备 的 上 时间， 不 过 所 有 的 参与 者 部 只 用 了 差不多 
1 小 时 。 在 准备 完毕 后 ， 第 二 个 组 员 加 入 ， 我 们 称 之 为 新 手 。 专 家 将 向 新 手 介 绍 程序 的 设计 。 随 
后 ， 两 个 组 员 将 合作 完成 两 个 维护 任务 。 这 样 的 方法 让 我 们 可 以 观察 到 两 个 有 趣 的 沟通 阶段 : 一 
是 专家 给 新 手 介 绍 程序 的 阶段 ， 二 是 两 个 组 员 之 间 的 合作 阶段 。 

设计 模式 知识 作为 独立 变量 出 现 ， 也 就 征 说， 他 们 的 设计 重 芭 知识 都 相同 。 首 先 ， 我 们 会 在 
参与 者 们 参加 培训 前 做 一 次 实验 , 然后 他 们 会 进行 三 个 月 关于 设计 模式 鸭 的 培训 , 最 后 再 进行 一 
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次 培训 后 的 实验 。 整 个 实验 从 1999 年 4 月 一 下 进行 到 了 同年 8 月 。 培训 课程 包含 关于 所 有 实验 中 涉 
及 的 (及 没 涉 及 的 ) 各 种 模式 的 实用 练习 。 培训 前 后 的 两 次 实验 分 别 使 用 了 两 个 不 同 的 应 用 程序 。 
同 此 前 一 样 ， 为 了 平衡 应 用 程序 复杂 度 的 区 别 ， 这 些小 组 被 分 成 了 两 批 ， 并 交 巷 着 进行 实验 。 为 
了 平衡 个 人 能 力 的 影响 , 在 两 次 实验 中 ,专家 和 新 手 的 角色 也 会 相互 转换 。15 位 参与 者 都 是 计算 
机 科学 专业 的 硕士 生 ， 都 古 第 4 学 年 在 读 ， 在 实验 之 前 没有 设计 模式 方面 的 经 验 。 

接 下 来 的 回 题 是 如 何 分 析 录 音 和 有 录像。 其 中 的 一 个 研究 人 员 把 交流 的 音频 和 视频 转录 成 了 文 
字 对 话 ， 然 后 用 了 一 个 简单 的 方案 来 为 这 些 对 话 分 类 。( 这 样 的 做 法 工程 浩大 。 仅 为 一 组 的 对 话 
进行 分 类 就 化 了 4 个 多 星期 ， 而 总 共有 12 组 对 话 。) 分 类 方案 将 标 出 说 话 者 ， 以 及 言论 的 类 型 ， 如 
提问 、 回 答 、 反 馈 以 及 介绍 设计 时 所 做 出 的 的 宣言 。 介 绍 设计 时 做 出 的 宣言 尤为 重要 ， 因 为 其 包 
含 了 关键 的 设计 信息 ,分析 的 方法 如 下 : 每 次 专家 的 宣言 我 们 都 算 作 +1 , 每 次 新 手 的 宣言 算 作 一 1。 
我 们 会 计算 出 70 条 数据 的 移动 平均 值 , 并 缩放 到 一 10 至 10 这 个 沁 围 内 。 移动 平均 值 的 图 表 我 们 称 
之 为 沟通 线 。 图 22-6 展 示 的 是 我 们 假设 的 理想 沟通 线 。 在 介绍 阶段 ， 当 专家 介绍 程序 的 时 候 ， 沟 
通 线 应 该 达到 +10。 在 第 一 个 任务 分 配 完成 后 ， 如 末 新 手 和 专家 都 同时 参与 讨论 的 话 ， 这 条 线 应 
该 下 降 到 0。 两 项 任务 分 配 的 时 间 由 两 根 垂 直 的 实 线 表 示 ， 虚 线 表 示 移 动 平均 值 在 实 线 附 近 的 苑 
围 。 由 于 沟通 逐步 趋 于 平衡 ， 所 以 从 10 到 0 的 下 降 不 古 垂 直 而 是 倾斜 的 。 当 我 们 把 理想 的 交流 线 
和 实际 的 交流 线 相 登 加 的 时 候 , 就 可 以 从 两 者 之 间 的 偏差 中 看 出 一 些 端倪 ， 比 如 茶 个 组 员 在 交流 
中 占 了 主导 地 位 。 通 过 对 同一 个 小 组 在 培训 前 后 两 次 进行 的 实验 的 交流 线 进行 对 比 , 我们 可 以 从 
质量 和 数量 上 看 出 ， 专 家 对 程序 的 解释 是 否 有 效 ， 以 及 合作 阶段 的 沟通 是 否 均 衡 。 
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图 22-6 ”理想 的 交流 线 


SERA, 在 培训 前 的 实验 中 ， 所 有 的 交流 线 都 严重 失衡 ,而 大 部 分 培训 后 实验 的 交流 线 在 
解释 阶段 会 有 些 “ 隆 起 ， 然 后 逐 送 均衡 在 0 周围 。 图 22-7 展 示 了 T1 组 的 培训 前 实验 结 末 。 这 里 我 
们 看 到 了 新 手 占 交 流 主 导 权 的 情况 : 专家 开始 解释 ,但 是 几乎 就 在 同时 ， 新手 (刚刚 开始 对 软件 
一 无 所 知 ) 就 主导 了 讨论 ， 这 可 以 从 交流 线 掉 到 0L 下 看 出 。 我 们 再 来 对 比 一 下 图 22-8 中 的 交流 
ko 这 张 图 展示 的 是 经 过 培训 之 后 的 情况 。 现 在 专家 和 新 手 互 换 了。 请 回忆 一 下 图 22-7 之 中 主导 
交流 的 那个 人 注意 此 时 角色 已 转换 )。 现 在 ， 当 他 们 讨论 维护 任务 的 时 候 ， 早 前 交流 稍 差 一 些 
的 那个 组 员 也 能 积极 参与 进来 ， 二 人 的 交流 变 得 平衡 起 来 。 

图 22-9 和 图 22-10 展 示 的 则 古 一 个 专家 主导 交流 的 例子 。 在 培训 前 的 实验 中 , 专家 从 头 到 尾 地 
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主导 了 整个 对 话 ， 但 十 在 培训 后 交流 变 平 衡 了 。 





图 22-7 Tl 组 的 交流 线 (培训 前 ) 图 22-8 Tl 组 的 交流 线 (培训 后 ) 





图 22-9 T4 组 的 交流 线 (培训 前 ) 图 22-10 T4 组 的 交流 线 (培训 后 ) 


为 了 进行 量化 分 析 , 我 们 计算 了 每 个 小 组 理想 交流 线 和 实际 交流 线 的 区 别 (包括 培训 前 后 两 
次 实验 )。 首 先 ， 我 们 把 理想 交流 线 和 实际 交流 线 中 第 一 个 任务 所 对 应 的 数据 点 重合 起 来 。 然 后 ， 
我 们 对 两 个 阶段 的 理想 和 实际 交流 线 之 间 的 差别 做 1000 次 数据 采样 ,并 计算 出 欧 氏 距离 。 每 个 组 
培训 前 后 的 两 次 实验 结果 都 表现 出 了 明显 差异 。Wilcoxon 测 试 表明 ， 这 些 差别 的 统计 显著 值 是 
0.05。 对 于 这 些 对 话 的 性 质 分 析 显 示 ， 在 培训 前 后 的 谈话 中 参与 者 们 都 谈 到 了 设计 模式 ， 但 是 在 
培训 后 的 谈话 中 ,关于 设计 模式 的 交流 更 加 均衡 一 些 。 在 培训 前 的 实验 中 , 参与 者 们 虽然 也 使 用 
模式 术语 ， 但 是 却 对 这 些 术 语 的 意义 知之 其 少 。 

Shree AR AE eA, PV DAAC AR EES VII aS SEC. 在 对 设计 模式 没有 共同 认 
TASTE UL T, AREN Bede Aa aE BAR AS Se A, MEAIM Sas SAP RED TE 
但 是 , FE= 7 ATES I, BT eT A a ee A PET Ee, PRA Ee EY 
工作 阶段 。 即 使 是 能 力 稍 差 一 些 的 组 员 也 能 够 同等 地 参与 到 设计 的 讨论 中 来 。 我 们 的 实验 结 末 文 
持 了 此 前 的 假设 , 即 设计 模式 能 让 团队 成 员 之 间 的 交流 更 加 有 效 。 很 明显 ,把 真正 有 用 的 设计 概 
念 放 到 记忆 区 块 里 确实 可 以 改善 交流 的 效率 。 


22.6 ”经 验 教训 


设计 和 进行 这 一 系列 的 实 骆 也 让 我 们 学 到 了 很 多 。 设 计 这 些 实验 的 时 候 我 们 遇 到 了 不 少 难 

















® Wilconxon 测 试 评估 的 是 两 个 样本 是 否 是 从 同一 个 统计 总 体 中 取出 的 , 统计 总 体 无 需 是 正 态 分 布 。 如 需 更 详细 的 介 
绍 请 参见 参考 文献 [53] 中 的 Mann-Whiteney 训 试 。 
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题 。 我 们 曾经 认为 添加 模式 文档 是 非常 简单 的 ， 但 是 要 想 “ 公 正 ” 地 做 出 两 套 具 备 可 比 性 的 程序 
很 难 , 因为 我 们 设计 的 普通 版 程序 总 是 和 设计 模式 版 的 程序 非常 相似 一 一 我 们 这 些 研 究 人 员 的 思 
想 早已 被 “设计 模式 化 ”了 ! 直到 我 们 都 确认 普通 版 的 程序 比 设计 模 式 版 的 更 简单 但 灵活 性 要 稍 
微 差 一 些 (这 正 是 我 们 想 要 的 ) 之 后 ， 实 验 才 得 以 继续 。 为 了 寻找 记录 交流 的 方法 ， FRA 
尽 脑 汁 。 在 阅读 了 大 量 实验 设计 的 资料 之 后 ， 我 们 决定 使 用 对 话 分 析 法 。 但 是 又 应 该 如 何 处 理 这 
些 对 话 呢 ?我 们 最 后 采取 了 Barbara Unger 的 天 才 创 意见 致谢 部 分 )， 即 使 用 理想 交流 线 ， 并 用 
它 和 实际 交流 线 做 对 比 。 准 备 、 执 行 和 分 析 实 验 所 和 需 的 时 间 大 大 超 乎 了 我 们 的 预料 ( 花 了 差不多 
写 三 篇 博士 论文 的 时 间 ) ， 但 是 我 们 选择 的 时 间 点 是 合适 的 ， 当 时 设计 模式 这 个 话题 还 很 新 ， 参 
与 者 也 很 容易 束 找 到 了 。 在 最 后 ， 实 验 的 结 采 或 舞 人 心 。 

Christensen 那 本 关于 实验 设计 的 书 中 简直 是 老 天 的 恩赐 。 这 本 书 已 经 出 到 第 10 版 了 ， 内 容 涵 
盖 了 所 有 主要 的 实验 方法 。 

当 参 与 者 需要 进行 多 项 任务 的 时 候 , 我 们 推荐 使 用 制衡 性 实验 设计 的 方法 。 除了 需要 组 织 工 
作 之 外 ,制衡 性 实验 设计 并 不 费 什么 事 , 但 是 可 以 让 我 们 检查 是 否 存在 学 习 效 应 的 问题 ， 这 使 我 
们 更 安心 。 此外, 制衡 实验 设计 还 降低 了 抄 族 的 可 能 性 , 因为 同 桌 的 参与 者 来 自 不 同 的 小 组 。( 抄 
认可 能 造成 数据 重复 ,使 我 们 收集 不 到 足够 的 数据 ， 并 有 可 能 筑 挥 整个 实验 。) 对 于 结果 的 分 析 ， 
我 们 推荐 使 用 免费 的 统计 工具 R。 你 可 以 在 www.r-project.org 下 载 。 

下 面 我 们 的 做 法 将 和 一 般 的 有 所 不 同 。 在 统计 检验 中 有 “统计 效力 ”的 概念 。 统 计 效 力 指 找 
到 不 同 实验 方法 之 间 的 区 别 〈 如 果 有 的 话 ) 的 概率 。 将 这 个 概率 保持 在 高 位 (比如 80%) 非常 重 
要 ,否则 的 话 ， 实 验 结果 就 有 可 能 是 无 效 的 (这 些 实验 得 不 出 结果 ， 因 为 得 出 结果 的 概率 太 低 )。 
这 时 候 统 计 效 力 分 析 就 起 作用 了 。 信 单 来 说 分 析 的 流程 就 是 : 在 正式 实验 前 先 让 少量 参与 者 做 一 
个 测试 ， 以 此 确定 大 概 的 结 采 范围 。 有 这 个 信息 ， 我 们 束 能 确定 需要 多 少 参 与 者 才能 达到 预期 的 
统计 效力 以 及 显 兰 性 水 平 。 我 们 很 至 运 ， 预 估 的 结果 旋 围 就 足够 大 了 ， 所 以 我 们 仅 用 现 有 的 参与 
者 就 能 够 达到 想 要 的 结果 。 如果 结 果 沁 围 太 小 , 那么 需要 的 参与 者 数量 很 容易 束 诡 升 到 80 或 者 120 
T, 而 要 想 找到 如 此 多 的 参与 者 非常 困难 。 统 计 效 力 分 析 的 方法 在 很 多 统计 学 的 书籍 中 都 有 介绍 ， 
如 参考 文献 [5] 的 第 1$ 章 。 很 多 统计 工具 (比如 R) 都 提供 了 统计 效力 分 析 的 工具 。 一 定 要 在 开始 
实验 之 前 确定 参与 者 的 数量 是 否 足 人 够 , 否则 最 后 你 可 能 实验 做 不 成 , 反而 会 一 直 停 留 在 寻找 更 多 
参与 者 的 阶段 | 

还 有 一 个 问题 我 们 早 前 没有 意料 到 , 答案 的 正确 性 和 参与 者 消耗 的 时 间 不 能 相互 独立 地 进行 
分 析 。 很 明显 ， 敷 衍 一 个 答案 几乎 不 用 花 时 间 ， 但 是 好 的 从 和 案 则 需要 多 一 点 时 间 。 我 们 现在 已 经 
意识 到 育 目 地 单独 比较 工作 时 间 是 不 合适 的 , 反之 必须 在 答案 的 质量 一 致 的 情况 下 再 来 对 比 销 耗 
的 时 间 。 比 如 ， 可 以 设 定 三 个 正确 度 等 级 ， 然 后 按 级 别 来 比较 消耗 的 上 时间。 但 是 这 有 一 个 问题 ， 
就 是 所 需 的 参与 者 数量 。 每 个 正确 度 的 等 级 都 需要 足够 数 日 的 参与 者 来 确保 统计 的 显著 性 及 效 
A, 也 就 是 说 ， 我 们 将 需要 三 倍 的 参与 者 。 男 一 种 方法 是 用 验收 检测 的 方式 来 确保 正确 度 。 参 与 
者 们 不 靳 地 进行 任务 ， 直 到 提交 的 党 案 通 过 验收 检测 。 如 些 ， 就 能 保证 所 有 参与 者 的 答案 都 满足 
最 低 正 确 度 的 要 求 。 我 们 可 以 用 自动 化 测试 套件 的 方式 来 进行 验收 检 测 。 参 与 者 可 以 自行 检测 ， 
也 可 以 交 由 人 研究 人 员 检 测 。 虽然 研究 人 员 也 可 以 在 实验 过 程 中 亲 目 检查 答案 并 在 有 不 可 接受 的 钳 
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误 的 时 候 驳 回 , 但 十 这 样 的 做 法 会 让 人 研究 的 客观 性 受到 一 些 影 响 ， 所 以 我 们 不 推荐 。 一 旦 验收 测 
试 通过 之 后 , 研究 人 员 就 可 以 开始 计算 时 间 和 其 他 需要 的 数据 了 。 在 验收 测试 之 后 , WEA RAE 
可 以 使 用 一 套 更 完善 的 方案 来 更 详细 地 区 分 质量 。 关于 最 早 使 用 验收 测试 的 实验 的 详细 情况 ,请 
参见 参考 文献 [7]。 


22.7 RZ 


ieee — VP ARS, PLA ERA — Se oe REE BATT Ze, BREER EA i. AH 
re MRA SAE (ECLA EAE, Be EE BS, FT a (有 两 个 经 过 了 重 
复 实验 ) 来 收集 设计 模式 有 效 性 的 相关 证 据 。 第 一 组 实验 的 结 末 表 明 , 仅仅 只 是 为 设计 模式 加 上 
文档 , 就 可 以 改善 程序 员 的 效率 并 降低 执行 维护 任务 时 的 错误 。 在 男 一 组 对 专业 人 士 进行 的 实验 
中 ,我 们 将 设计 模式 的 解决 方案 和 简单 的 临时 性 解决 方案 做 了 对 比 。 在 这 些 实验 中 , 使 用 设计 模 
式 需 要 一 定 的 额外 工作 ,但 是 在 大 多 数 情 况 下 这 种 额外 工作 被 抵消 了 ， 因 为 维护 变 得 更 价 单 了 。 
最 后 一 个 实验 的 结 末 显示 ,在 对 设计 模式 有 共同 认识 的 情况 下 , 组 员 之 间 的 交流 得 到 了 改善 。 在 
第 一 和 第 三 个 实验 中 ,还 有 一 些 证 据 表 明 , 在 使 用 设计 模式 的 情况 下 ， 能力 和 差 一 些 的 程序 员 也 
能 赶 上 经 验 更 丰富 的 程序 员 。 

这 些 结 末 有 力 地 证 明了 设计 模式 能 在 维护 工作 中 有 效 提 升 软件 质量 及 程序 员 的 效率 。 看 来 相 
信 设 计 模 式 并 没有 和 错 | 

但 是 , 设计 模式 对 于 软件 的 急 始 开发 有 没有 积极 的 作用 仍然 有 竺 考察。 关于 这 个 课题 有 一 个 
相关 的 实验 ， 这 个 实验 从 API 的 易 用 性 的 角度 来 分 析 了 抽象 工厂 模式 ”。 实 验 的 结果 表明 ， 程 序 
员 在 使 用 抽象 工厂 生成 对 象 时 消耗 的 时 间 比 起 直接 用 构造 禹 消耗 得 多 很 多 。 但 是 , 这 次 实验 并 设 
有 发 挥 抽象 工厂 模式 的 长 处 : 它 测 试 的 是 构建 单个 对 象 ， 而 不 古 处 理 一 系列 类 似 的 对 象 。 在 实验 
中 ， 这 个 模式 无 法 发 挥 其 (本 应 有 的 ) 优势 。 这 个 例子 说 明了 要 想 设计 行 之 有 效 的 实验 是 多 么 困 
难 。 不 过 ， 我 们 还 古 需 要 更 多 的 实验 来 测试 设计 模式 在 初始 开发 阶段 的 效 未 ， 而 API 多 用 性 这 个 
Fy Vel EE AE HY 
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第 23 章 
特 证 故障 预测 


Nachiappan Nagappan 
Thomas Ball 


实证 软件 工程 (SE) 的 研究 从 软件 工件 及 其 相关 的 流程 和 变量 中 收集 并 分 析 数 据 , 然后 通过 
量化 、 定 性 等 方式 来 探索 不 同 变量 与 项 目 成 功 之 间 的 关系 。( 这 里 的 项 目 成 功 指 在 预算 内 按时 交 
付 高 质量 的 安全 软件 。) 在 这 一 章 中 ， 我 们 会 讨论 Windows 操 作 系 统 家 族 中 故障 预测 的 实证 研 
Fo Windows 是 一 个 大 型 商业 软件 系统 ， 主 要 用 C / C ++ / C# 开 发 ， 在 全 球 有 着 数 亿 用 户 。 有 成 
百 上 千 位 工程 师 参 与 了 这 个 项 目 ， 代 但 量 超过 四 千 万 行 。 
故障 预测 是 实证 软件 工程 的 一 个 重要 部 分 , 人 们 用 它 来 了 解 软 件 维护 所 需 的 测试 工作 量 和 将 
来 的 资源 分 配 ， 如 下 所 述 。 
ot E G 
在 每 个 大 型 软件 开发 中 ,软件 质量 保证 (quality assurance) 都 会 占用 大 量 的 时 间 。 为 了 
提高 这 项 工作 的 有 效 性 ,需要 提前 为 容易 出 错 的 模块 制定 修复 计划 。 越 容易 出 错 的 地 方 , 越 
需要 质量 保证 。 
ae BB 
Ay cP Ce AY AB AE, PERE AT. Ee HE EH Be PAY 
问题 解决 方法 ， 等 等 。 修 改 所 伴随 的 风险 〈 或 修改 之 后 出 错 的 可 能 性 ) 能 帮助 对 修改 所 带 来 的 
风险 做 出 决策 。 故 障 预 测 也 可 以 用 来 评估 系统 的 总 体 稳 定性 ， 帮 助 判断 征 否 能 按时 完成 项 目 。 


我 们 会 逐步 讨论 各 种 故障 预测 的 指标 。 对 于 每 一 组 指标 ,我 们 会 讨论 选择 此 指标 的 原因 ， 对 
这 一 指标 的 相关 揪 述 ， 以 及 在 大 型 商用 项 目 上 使 用 这 些 指 标 进 行 故障 预测 的 结 来 。 








23.1 简介 


对 于 软件 企业 来 说 , 越 早 估计 产品 质量 越 有 利 。 因 为 我 们 只 有 在 开发 的 中 后 期 才能 看 出 实际 
产品 质量 , 那 时 修改 缺陷 的 代价 会 很 高 "。IEEE 软 件 工程 术语 的 标准 汇编 “把 瀑布 式 软件 开发 周 
期 定义 为 “一 个 包含 诸多 活动 的 软件 开发 流程 模型 ， 通 向 有 概念 阶段 、 需 求 阶 段 、 设 计 阶 段 、 实 
现 阶段 、 测 试 阶段 、 安 装 检验 阶段 ， 这 些 阶 段 按照 顺序 进行 ， 也 许 会 有 重 玲 ,但 几乎 没有 迭代 ?”。 
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我 们 可 以 在 开发 周期 收集 与 质量 相关 的 各 种 指标 。 我 们 的 目标 是 利用 这 些 指标 , 在 开发 周期 的 早 
期 一 一 开发 和 测试 阶段 ， 就 能 预测 出 产品 发 布 之 后 可 能 发 生 的 故障 。 预测 结果 可 以 用 来 辅助 重 
点 测试 、 代 码 和 设计 的 审查 ， 并 能 以 适当 的 代价 指导 缺陷 的 修正 。 

指标 的 选择 基于 实证 技术 ， 比 如 GQM 原 则 站， 以 此 来 客观 评估 指标 选择 对 于 分 析 的 重要 性 。 
内 部 指标 (度量) , 如 圈 复杂 度 1, 来自 于 产品 本 身 。 外 部 指标 来 自 于 对 系统 行为 的 外 部 评估 。 例 
如 ,现场 发 现 缺陷 的 数量 是 一 个 外 部 指标 。ISO /IEC 标 准 “ 指 出， 一 个 内 部 指标 只 有 在 能 证 明 与 
可 见 的 外 部 属性 相关 时 才 有 意义 。 当 内 部 指标 与 现场 的 质量 和 可 靠 性 有 稳定 的 统计 显著 关系 时 ， 
我 们 才 可 以 把 它 作 为 早期 指标 来 预测 可 见 的 外 部 产品 质量 。 所 以 验证 内 部 指标 需要 有 令 人 信服 的 
证 据 来 证 明 : (1) 该 指标 度量 了 希望 度量 的 东西 ， (2) 它 与 重要 的 外 部 指标 相关 联 ， 如 现场 的 
可 靠 性 、 可 维护 性 、 易 出 错 性 站。 

在 这 一 章 中 我 们 会 讨论 六 种 不 同 的 故障 预测 指标 集 , 描述 它们 的 内 容 , 表明 它们 对 于 故障 预 
测 的 重要 性 。 我 们 也 会 提供 一 个 微软 商业 案例 研究 的 公开 结果 ,以 及 相关 的 参考 文献 。 最 后 ,我 
们 会 对 故障 预测 做 出 总 结 ， 并 讨论 一 些 未 来 的 重要 领域 。 六 组 预测 缺陷 的 内 部 指标 包括 : 

(1) REAK; 

(2) 代码 变动 ， 

(3) 代码 复杂 度 ， 

(4) 代码 依赖 ; 

(5) 人 员 以 及 组 织 指 标 ，; 

(O 综合 方法 。 

在 Windows 的 案例 中 ， 我 们 评估 的 对 象 是 二 进 制 可 执行 文件 。 二 进 制 文件 是 由 源 文件 编译 而 
来 的 exe、dll 或 sys 文 件 。 我 们 选择 二 进 制 文件 的 原因 是 : (1) 现场 故障 能 最 直接 地 映射 回 二 进 制 
文件 ; (2) 故障 修复 往往 涉及 几 个 文件 的 修改 ， 大 部 分 会 被 编译 在 一 个 二 进 制 文件 中 ; (3) 二 进 
制 文件 最 起 码 能 保证 代码 所 有 权 ， 从 而 使 结果 更 具有 可 操作 性 。 从 历史 数据 上 看 , 微软 用 二 进 制 
文件 作为 度量 单元 ， 是 因为 它 可 以 准确 地 把 客户 缺陷 映射 回来 。 

我 们 会 从 一 个 来 自 于 微软 Windows Vista 或 Windows Server 2003 的 故障 预测 案例 分 析 中 ， 为 所 
有 六 组 指标 提供 证 据 。 我 们 会 提供 每 一 个 与 预测 相关 的 查 准 率 (precision) 和 查 全 率 (recall), 
或 者 是 准确 率 (accuracy)。 查 准 率 测量 的 是 漏 报 率 (false-negative)， 指 易 出 错 的 二 进 制 文件 被 归 
于 不 易 出 错 的 比率 。 查 全 率 测 量 的 是 误 报 率 (false-positive)， 指 不 易 出 错 的 二 进 制 文件 被 归于 是 
易 出 错 的 比率 。 这 里 我 们 专注 的 是 故障 预测 的 指标 ， 而 不 是 统计 或 机 如 学 习 之 类 的 技术 指标 ， 
后 者 可 以 使 用 如 逻辑 回归 、 决 策 树 、 支 持 向 量 机 等 标准 技术 “1。 

如 同 所 有 的 软件 工程 实验 证 据 研究 一 样 , 要 从 软件 工程 的 实证 研究 中 得 出 通用 的 结论 是 很 困 
难 的 ， 因 为 任何 进展 都 很 大 程度 上 取决 于 有 关 的 环境 变量 中 。 出 于 这 个 原因 ， 我 们 不 能 预先 假设 
在 特定 环境 中 得 出 的 研究 结果 能 推广 到 更 普遍 的 情况 趾 。 如 果 一 种 理论 能 在 不 同 的 情况 下 得 出 相 
同 的 结果 ， 那 么 研究 者 会 对 它 更 有 信心 站。 所 以 我 们 鼓励 读者 在 可 能 的 情况 下 自己 进行 调查 ,在 




















O 机 器 学 习 : 是 人 工 智能 的 一 个 分 支 ， 关 注 于 设计 和 开发 一 些 算 法 ， 让 计算 机 可 以 根据 实证 数据 〈 如 数据 库 中 ) 自 
动 “ 学 习 ” 行 为 。 更 具体 地 说 ， 机 器 学 习 是 一 种 用 于 创建 数据 集 分 析 程 序 的 方法 。 一 一 译 者 广 
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他 们 的 环境 中 重复 这 项 研究 之 后 再 做 出 结论 。 我们 希望 本 革 可 以 用 作 一 份 文档 , 包含 已 经 被 证 明 
在 微软 能 够 成 功 (或 不 成 功 ) 地 预测 故障 的 指标 和 功能 集 。 


23.2 RBAK 


代码 覆盖 率 是 一 项 重要 指标 ， 可 以 用 来 量化 测试 范围 。 其 背后 的 主要 假设 是 ， 如 果 一 个 分 支 
或 一 个 语句 包含 一 个 缺陷 ， 至 少 需 要 一 个 测试 执行 该 语句 或 分 支 (并 且 所 测 结果 与 预期 不 符 ) 才 
能 发 现 缺 陷 。 可 以 讨论 的 是 ， 代 码 覆 盖 率 越 高 ， 检 测 到 的 代码 忽 陷 就 越 多 ， 如 果 这 些 铅 陷 被 修复 
T, 那么 产品 的 质量 就 会 越 好 。 该 假设 虽然 被 广泛 认同 , 但 是 没有 证 据 显 示 代 码 测 试 履 盖 率 越 高 ， 
最 终 的 故障 会 越 少 。 
代码 覆盖 率 越 高 质量 越 好 这 个 论点 有 许多 溢 在 的 破绽 。 首 先 ,覆盖 率 反 映 了 被 覆盖 语句 的 百 
分 比 , 但 没有 考虑 这 些 语句 是 否 有 可 能 包含 缺陷 。 因 此 ， 可 能 存在 两 个 具有 相同 的 覆盖 率 的 测试 
集合 ,但 两 者 检测 到 发 布 后 缺陷 的 能 力 相 差 很 多 。 其 次 ,一 个 语句 或 分 支 被 运行 过 并 不 意味 着 所 
有 可 能 的 数据 都 被 运行 过 。 用 户 的 使 用 情况 可 能 与 测试 人 员 设想 的 完全 不 同 。 用 几 个 测试 用 例 就 
可 以 覆盖 的 、 控 制 流程 简单 的 系统 需要 特别 注意 这 个 问题 。 在 我 们 对 代码 有 覆盖 率 的 研究 中 ， 基 于 
与 工程 师 的 定性 访谈 (相对 于 定量 )， 我 们 发 现 了 造成 此 现象 的 几 个 相关 因素 ”1。 
口 测试 履 盖 的 代码 不 是 正确 的 代码 。 
口 开发 人 员 知 道 某 些 二 进 制 文件 是 很 复杂 的 ， 所 以 会 给 它们 加 上 很 高 的 测试 覆盖 率 。 但 是 ， 
这 些 二 进 制 文件 也 许 是 在 系统 中 最 经 常 被 使 用 到 的 ， 因 此 也 会 发 现 更 多 的 缺陷 。 也 就 是 
说 ， 代 码 有 覆盖 和 使 用 模式 不 匹配 。 
口 考虑 代码 覆盖 率 时 也 应 该 考虑 代码 复杂 度 。 例 如 ， 在 圈 复 杂 度 为 1000 的 二 进 制 文件 中 实 
现 80% 的 代码 覆盖 率 ， 比 在 圈 复 杂 度 为 10 的 二 进 制 文件 上 实现 80% 的 覆盖 率 困难 。 结 合 复 
杂 度 讨论 代码 覆盖 率 有 助 于 充分 使 用 该 指标 的 功效 。 
尽管 存在 这 些 破绽 ， 由 于 其 在 实践 中 的 广泛 使 用 ， 和 覆盖 率 似乎 仍然 是 一 个 有 前 景 的 指标 。 然 
而 ， 很 少 有 出 版 物证 明代 码 履 盖 率 与 产品 质量 间 的 关系 。 目前 大 多 数 这 方面 的 研究 存在 内 部 有 
效 性 问题 (比如 对 100 行 代码 程序 的 研究 )。 为 了 找到 代码 覆盖 率 和 质量 关系 间 的 证 据 ， 我 们 把 
Windows Vista (4 千 多 万 行 代码 、 几 千 个 二 进 制 文件 、 数 千 名 工程 师 ) 的 分 支 覆 盖 率 (branch 
coverage) 与 块 覆 盖 率 (block coverage) 和 其 发 布 后 六 个 月 内 的 现场 缺陷 对 应 起 来 。 我 们 观察 到 
害 盖 率 和 质量 之 间 有 弱 的 正 相关 性 ， 预 测 查 准 率 和 查 全 率 较 差 ( 查 准 率 83.8%， 查 全 率 54.8%, 
进一步 阅读 , 请 参见 参考 文献 [20])。 对 这 个 直接 而 人 简单 的 假设 的 调查 结果 使 我 们 相信 ， 代 码 覆 盖 
率 最 好 不 要 单独 使 用 ， 而 是 需要 与 其 他 指标 ， 如 代码 变动 率 ， 复 杂 度 等 一 并 考虑 。 


23.3 ”代码 变动 


随 着 时 间 的 推移 ， 需求 的 改变 、 代 码 优化 、 对 安全 性 与 可 靠 性 问题 的 修复 等 原因 ， 软件 系 统 
一 直 在 演变 。 代 码 变动 指标 度量 了 一 段 时 间 内 一 个 模块 的 改动 ， 并 量化 了 改动 的 程度 。 版 本 控制 
系统 会 日 动 记录 下 修改 历史 , 我 们 很 容易 就 可 以 从 中 得 到 相关 的 数据 。 大 多 数 版 本 控制 系统 使 用 
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文件 比较 工具 (如 Diff)， 自 动 估计 一 个 程序 员 从 旧版 本 到 新 版 本 的 文件 中 添加 、 删 除 、 修 改 了 多 
少 行 代码 。 这 些 差 异 就 是 得 出 代码 变动 指标 的 基础 。 

要 得 到 相对 代码 变动 指标 , 束 要 对 各 种 代码 变动 指标 进行 标准 化 。 标 准 化 参数 包括 代码 的 总 
行 数 、 文 件 变动 数量 、 文 件 总 数量 等 。 对 于 一 个 不 断 变 化 的 系统 ， 推 荐 使 用 相对 方法 来 量化 系统 
的 变化 。 据 我 们 研究 所 示 ， 可 以 将 这 些 相 对 指标 设计 成 相互 交叉 检查 ， 那 它们 束 不 会 提供 相互 矛 
盾 的 信息 。 我 们 的 基本 假设 是 ， 在 产品 发 布 之 前 的 同一 段 时 间 内 ,修改 次 数 多 的 代码 比 修改 次 数 
少 的 代码 更 容易 在 发 布 之 后 发 现 缺 陷 。 

我 们 分 析 了 Windows Server 2003 (W2k3) 发 布 之 后 到 W2k3 服 务 包 1 (W2k3 - SP1) 发 布 这 
段 时 间 内 的 代码 变动 指标 来 预测 W2k3-Sp1 的 缺陷 密度 。 我 们 使 用 了 直接 收集 到 的 代码 变动 指标 ， 
包括 添加 、 修 改 和 删除 的 代码 行 数 (LOC)， 也 收集 了 时 间 和 文件 数量 来 计算 出 一 组 相对 代码 变 
动 指标 ”|。 

e (01: QHUUUUUOUUUET 

我 们 预计 对 于 新 的 二 进 制 文 件 来 说 ， 变 动 (增加 + 更 改 ) 代码 的 比率 越 高 ， 它 的 缺陷 密 

度 就 越 大 。 

e (02: 00000000000 

我 们 预计 对 于 新 的 二 进 制 文件 来 说 ， 删 除 代 码 的 比率 越 高 ， TEU 2 RE EK o 
e 003: VUUUUOUUOU 
RII EIS EL CAR DA LE, SLA RIAA BT EAC. 例如, 假 

设 A 和 B 两 个 二 进 制 文件 各 包含 20 个 文件 。 如 采 A 有 5 个 文件 变动 过 ，B 有 2 个 ， 我 们 认为 A 的 

缺陷 密度 会 比 B 高 。 

e DD4:000000 人 UU00U0 

假设 A 和 B 两 个 二 进 制 文件 , 各 包 仿 20 个 文件 ， 其 中 的 5 个 变动 过 。 如 果 A 的 5 个 文件 变动 

过 20 次 ， 而 B 的 五 个 文件 是 变动 过 10 次 ， 那 么 我 们 预测 A 会 有 更 高 的 缺陷 密度 。 指 数 4 也 被 

用 来 交 又 检查 指数 3 的 值 。 

e DD5:00000000 人 U0U0 

指数 $ 用 于 计算 变动 的 时 间 范 围 。 指 慰 5 如 采 较 高 ,意味 着 花 了 较 长 的 时 间 来 修改 数量 较 

少 的 文件 。 这 可 能 表明 二 进 制 文件 可 能 包含 复杂 的 文件 ， 很 难 修改 正确 。 因 此 ,我 们 预计 指 

数 $ 越 高 ， 相 关 的 二 进 制 文件 的 缺陷 密度 也 越 高 。 

e H06: VUUUUUOUOUUUUUUUU 

代码 改变 总 行 数 是 指 变动 与 删除 的 代码 行 数 的 总 和 。 这 个 指标 度量 了 代码 随时 间 变 化 的 

程度 ， 用 以 交 又 检查 指标 5。 代 码 变动 所 耗 的 周 数 并 不 能 说 明代 码 变动 数量 。 指 标 6 对 应 于 我 

们 的 一 种 预期 ， 即 代码 改变 总 行 数 越 多 ， 所 耗 的 周 数 也 会 越 长 。 指 标 6 交 又 检查 指数 5 的 值 越 

e (07: VHUUUUUOUUUUET 

并 不 是 所 有 的 代码 变动 都 是 因为 修复 缺陷 , 指标 7 量化 了 新 进行 的 开发 。 在 功能 开发 时 ， 

变动 的 行 数 远 远大 于 删除 的 行 数 ， 所 以 指标 7 较 高 则 表示 功能 开发 正在 进行 中 。 指 标 7 可 以 交 
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又 检查 指标 1 和 指标 2， 这 两 者 邦 不 能 准确 地 预测 新 功能 的 开发 。 
SSE 

我 们 预计 每 次 代码 改变 涉及 的 行 数 越 多 , 缺陷 密度 就 会 越 高 。 指 标 8 可 以 交叉 检查 指标 3 
和 指标 4， 以 及 指标 5 和 指标 6。 相 对 指标 3 和 指标 4， 指 标 8 记 录 了 实际 发 生 的 代码 变动 量 。 
指标 8 交叉 检查 了 文件 是 否 因 为 小 的 修改 而 不 停 地 变动 。 指 标 8 还 交叉 检查 了 指标 5 和 指标 6， 
因为 指标 8 的 值 越 高 (代码 改变 所 涉及 行 数 越 多 ) ， 每 周 工作 的 时 间 (指标 5) 和 每 周 工作 的 
代码 行 数 会 越 高 《指标 6)。 如 和 不 是 这 样 ， 那 么 大 量 的 修改 可 能 是 在 很 得 的 时 间 内 进行 的 ， 
这 就 可 能 导致 缺陷 密度 的 提高 。 


在 使 用 随机 分 组 (random-splitting) 预测 W2K3 - SP1 中 容易 出 错 和 不 易 出 错 的 二 进 制 文件 时 ， 
相对 代码 变动 指标 组 成 的 预测 模型 达到 了 89% 准 确 率 。 此 外 ， 对 W2k3 - SP1 缺 陷 密度 的 预测 准确 
度 也 很 高 (如 图 23-1 所 示 )。 (为 了 保护 机 窗 数 据 ， 我 们 对 数 轴 上 的 数据 进行 了 标准 化 。) 实 线 以 
上 的 部 分 表示 高 鸽 值 ， 以 下 的 部 分 表示 低估 值 。 缺陷 密度 的 估计 值 与 实际 值 之 间 有 明显 的 正 相 关 
性 ， 并 且 显 示 出 统计 显 闭 性 ， 表 明 实 际 缺陷 密 度 升 高 时 ， 估 计 缺 陷 密 度 也 在 升 高 。 














缺陷 数量 / 千 行 代码 


估计 值 


247 329 411 493 575 
288 370 452 534 
aE LEF 








图 23-1 ”系统 缺陷 密度 的 实际 值 与 估计 值 局 
这 些 结果 加 之 先前 公布 的 研究 报告 结 来 〈 例 如 ， 参 考 文 献 21] 和 参考 文献 [26] 中 有 一 个 更 详 
细 的 清单 ) 表明 ， 代 码 变动 和 代码 质量 高 度 正 相 关 。 也 就 是 说 ， 在 一 个 系统 中 ， 如 果 代 码 变动 率 
较 高 则 表明 缺陷 也 更 多 。 考 虑 到 代码 变动 是 新 开发 软件 的 重要 组 成 部 分 (例如 ,产品 的 新 功能 )， 
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我 们 也 引入 了 相对 代码 变动 指标 ,通过 交叉 检查 来 减轻 这 个 问题 。 然 而 ,我们 的 结 末 也 清晰 地 表 
明 ， 代 码 变 动 率 必 须 与 其 他 内 部 指标 一 起 使 用 。 


23.4 ”代码 复杂 度 


讨论 了 代码 变动 之 后 ， 让 我 们 分 析 一 下 代码 复杂 度 。 也 就 是 说 ,一段 代码 的 复杂 度 对 预测 缺 
陷 能 力 的 影响 。 复 杂 度 可 以 用 几 个 指标 来 量化 ,分 为 面 癌 对象 和 非 面 癌 对 象 的 指标 ， 泥 围 从 传统 
的 指标 ， 诸 如 扇 人 扇 出 ， 到 最 新 的 CK 指 标 ” 。CK 指 标 组 包括 6 个 指标 (主要 被 设计 为 面向 对 象 
的 设计 指标 ): 每 类 加 权 方 法 数 (Weighted Methods per Class, WMC) ， 对 象 之 间 的 耦合 (CBO), 
继承 深度 (DIT)， 子 类 数量 (NOC)， 类 的 啊 应 (RFC)， 方法 间 的 低 内 聚 度 (LCOM)。 基 于 先 
前 发 表 的 一 些 指标 ， 微 软 使 用 的 面向 对 象 和 非 面向 对 象 的 复杂 度 指标 包括 如 下 几 项 。 





eHUUU 

可 执行 的 非 注 释 代码 行 数 。 
e D0DU0 

圈 复 杂 度 “度量 了 一 个 程序 单元 内 线性 独立 路 径 的 数目 。 
e Ul . 

AFERA INE PERI Hb ERI SCA FRB 

“U i 

Fa H FERRAR AEA RE H FEE PR CAI KB 
eHUUU 


一 个 类 中 的 函数 数量 , 包括 公有 (public) 国 数 ,私有 (private) 函数 , 受 保护 (protected) 
国 数 。 


e 0UUUDO 
继承 深度 指 一 个 类 的 最 大 继承 深度 。 
e OD 








与 其 他 类 的 耦合 可 以 通过 (a) 类 成 员 变量 ，(b) 函数 参数 ，(c) 类 成 员 函 数 体 中 定义 

的 局 部 类 ， 还 有 (d) 基 类 和 (e) 返回 类 型 。 

e000 

模块 内 直接 继承 目 同 一 父 类 的 子 类 数目 。 

在 Windows Vista 中 ， 使 用 这 些 指 标 来 预测 缺陷 的 查 准 率 为 79.3%， 查 全 率 为 66%。 这 些 数据 
表明 ， 虽 然 复 杂 度 可 以 较 好 地 预测 代码 质量 ， nen 动 指标 。Khoshgoftaar 等 人 做 了 一 些 
相关 的 研究 工作 。 他 们 研究 了 一 个 大 型 电信 遗留 系统 (包含 3.8 万 个 函数 ， 有 171 个 模块 ) 的 连续 
两 次 发 布 , 根据 16 个 静态 软件 产品 指标 识 另 a 当 该 模型 被 使 用 于 第 二 次 发 
布 上 时， 整体 误 判 率 为 21.0%。El Emam 等 在 大 型 的 电信 项 目 上 研究 了 类 的 大 小 与 缺陷 的 关系 中 。 
他 们 发 现 类 的 大 小 干扰 了 故障 预测 。CK 指 标 也 是 以 缺陷 发 生 的 背景 为 前 提 的 。Basili 等 人 用 了 8 
个 学 生 项 目 来 研究 软件 系统 的 出 错 倾 向 站。 他 们 指出 ，WMC、CBO、DIT、NOC 和 RFC 与 缺陷 相 
关 ， 而 LCOM 与 缺陷 无 关 。Briand 等 人 研究 了 一 个 业界 案例 ， 发 现 CBO、RFC、LCOM 与 类 的 易 
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出 错 性 有 关 ”。Tang 等 人 研究 了 三 个 实时 系统 在 测试 及 维护 时 发 现 的 缺陷 ”。WMC 和 RFC 的 值 
越 高 ， 出 错 倾 回 也 越 高 。 进 一 步 阅 读 ， 参 见 参 考 文 献 [23]、[8]、[4]。 


23.5 ”代码 依赖 


至 此 我 们 已 经 知道 代码 变动 与 复杂 度 可 以 很 好 地 预测 缺陷 。 这 也 局 发 我 们 结合 这 两 部 分 的 信 
上 来 有 效 量 化 不 同 代码 之 间 的 关系 。 一 般 来 说 ， 在 大 型 软件 的 开发 中 ,一 个 优秀 的 软件 架构 可 以 
让 每 个 团队 在 不 同 的 架构 模块 上 独立 工作 。 软件 依赖 指 的 是 两 部 分 代码 之 间 的 关联 ， 比 如 数据 依 
束 〈 模 块 A 使 用 了 模块 B 定 义 的 一 个 变量 ) 或 是 调用 依赖 〈 模 块 A 调 用 了 模块 B 定 义 的 一 个 国 数 )。 
假设 模块 A 与 模块 B 之 间 依 赖 关 系 很 多 。 如 采 模 块 B 在 不 同 版 本 之 间 变 化 很 大 , 那么 很 有 可 能 也 需 
要 修改 模块 A 来 适应 模块 B 的 修改 。 这 意味 着 代码 变动 会 随 着 代码 依赖 而 传递 。 所 以 ， 高 度 代码 
依赖 与 代码 变动 会 使 错误 波及 整个 系统 ， 从 而 降低 其 可 靠 度 。 

为 了 研究 用 代码 依赖 预测 缺陷 的 有 效 性 ， 我 们 研究 了 Windows Vista 一 进 制 文件 之 间 的 依赖 天 
系 。 我 们 统计 了 函数 级 的 代码 依赖 ， 包 括 调用 -被 调用 依赖 、 导 入 、 导 出 、 远 程 过 程 调用 (RPC)、 
COM、 注 册 表 访问 等 。 系 统 级 依 琥 关系 图 可 以 被 认为 古 一 张 Windows Vista RRMA, dt til 
文件 之 间 的 依赖 被 分 为 出 、 入 两 种 (incoming dependency, outgoing dependency)。 进 一 步 的 分 类 包 
括 了 二 进 制 文件 间 的 依赖 总 数 , 以 及 跨越 多 个 模块 的 二 进 制 文件 数 。 用 这 样 的 依赖 指标 构建 的 模型 
所 预测 查 准 率 与 查 全 率 分 别 为 14.4% 与 69.9%。 这 与 代码 复杂 度 得 出 的 结 琳 相 似 ， 但 没有 代码 变动 
得 到 的 结 霖 准确。 关于 Windows 中 用 代码 依赖 与 变化 来 预测 缺陷 的 生 例 可 以 参照 参考 文献 [22]。 

在 另 一 个 相关 研究 中 ，Schriter 等 人 发 现 导 入 依赖 可 以 预测 缺陷 ““”， 并 提出 了 另 一 种 方法 来 
预测 Java 类 中 的 缺陷 。 他 们 只 着 眼 于 一 个 类 所 使 用 的 模块 ， 而 不 古 类 本 映 的 复杂 度 。 在 对 Eclipse 
(开源 集成 开发 环境 ) 的 研究 中 ， 他 们 发 现 使 用 编译 包 所 造成 的 易 出 错 率 (71%) 比 使 用 GUI 包 
(14%) 大 很 多 。Von Mayrhauser 等 人 用 一 种 自 下 而 上 的 方法 建立 了 一 个 缺陷 构架 模型 ， 来 研究 软 
件 构 架 的 恶化 与 缺陷 之 间 的 关系 ” 。 该 模型 的 构建 结合 了 模块 间 的 缺陷 耦合 度 (degree of fault 
coupling) 以 及 一 个 缺陷 修复 时 涉及 这 两 个 模块 的 频率 。 人 研究 结 来 指 出 了 每 个 版 本 中 最 容易 出 错 
的 关联 ， 并 指出 同样 的 模块 关联 会 重复 出 错 ， 以 此 发 现 芍 在 的 构架 问题 。 
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康 威 法 则 声称 :“ 设 计 系 统 的 组 织 只 会 产 出 其 自身 沟通 结构 的 翻版 V, Fred Brooks 在 《人 
月 神话 》 一 书 中 也 提 到 产品 质量 受 组 织 结构 影响 很 大 ”…。 软 件 工程 是 一 个 复杂 的 工程 活动 。 开 发 
一 个 完整 的 产品 奎 涉 到 人 人、 流程 以 及 工具 。 实 践 中 ， 商 用 软件 开发 一 般 由 一 些 团 队 共 同 完成 ， 每 
个 团队 的 大 小 从 几 十 人 到 上 千 人 不 等 。 通 第 ,这 些 员 工 癌 组 织 结构 中 的 一 位 经 理 或 者 几 位 经 理 汇 
报 。 我 们 一 般 通 过 度量 代码 变动 、 代 码 复杂 度 、 代 码 覆 盖 率 、 代 码 依 赖 等 来 预测 缺陷 ， 但 这 样 的 
方式 忽视 了 软件 开发 中 的 另 一 个 关键 因素 ， 那 束 是 “人 与 组 织 结构 ”。 

软件 开发 的 全 球 化 使 得 许多 团队 分 散在 世界 各 地 ， 康 威 法 则 中 所 阐述 的 组 织 构 架 有 影响 也 日 
葵 彰 显 出 来 。 本 市 中 ， 我 们 使 用 八 个 指标 来 量化 组 织 复杂 度 ， 以 此 分 析 组 织 构架 与 软件 质量 的 
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关系 中 。 组 织 指标 所 度量 的 内 容 包 括 : 开发 人 员 之 间 的 组 织 距离 ， 工 作 于 同一 模块 的 员工 数量 ， 
组 织 中 多 任务 开发 人 员 的 数量 ， 组 织 中 某 一 个 模块 的 修改 次 数 。 我 们 使 用 这 些 指标 来 预测 
Windows Vista 中 容易 出 错 的 二 进 制 文件 。 部 分 指标 如 下 所 示 (详细 列表 请 参照 参考 文献 [25])。 
。0U00000NOEI 
接触 过 革 个 二 进 制 文 件 的 在 职工 程 师 的 绝对 数量 。 
e 0000000 NOED 
接触 过 某 个 二 进 制 文件 ， 并 且 在 软件 发 布 之 前 就 离职 的 工程 师 的 绝对 数量 。 
。0U000D0EFO 
二 进 制 文件 源 代码 的 编辑 总 数 。 一 次 编辑 指 工程 师 从 版 本 控制 系统 中 签 出 代码 、 修 改 代 
码 、 然 后 签 入 回去 。 与 每 次 编辑 中 修改 代码 的 行 数 无 关 。 
。0U000000DMo0 
该 指标 基于 二 进 制 文 件 编辑 次 数 来 决定 其 所 有 权 等 级 。 如 果 一 个 人 的 直属 工程 师 执行 
所 有 编辑 的 X% 以 上 ， 那 他 在 组 织 中 的 级 别 就 是 DMO。DMO 指 标 基 于 二 进 制 文件 上 的 活动 
来 决定 其 负责 人 。 基 于 Windows 的 历史 信息 ， 我 们 把 X% 设 为 75% 来 量化 负责 度 。 
«e 00000000 Pog 
汇报 给 DMO 级 别 负责 人 的 人 数 与 DMO 组 织 总 人 数 的 比率 。 
。 0000000000 ocop 
二 进 制 文件 负责 人 所 处 的 组 织 对 二 进 制 文件 编辑 的 百分比 , 如果 没有 负责 人 的 话 , 就 指 
编辑 最 多 的 组 织 。 
。0U0000000oow 
修改 某 二 进 制 文件 的 人 员 中 ， 处 在 DMO 级 别 的 人 数 与 所 有 参与 修改 人 数 的 比率 。 该 指 
数 越 高 越 好 。 
。0U000000oIO 
参与 10% 以 上 修改 的 组 织 数 量 ， 度 量 级 别 是 总 体 组 织 负责 人 。 


提出 这 些 指标 是 为 了 平衡 组 织 结 构 对 于 质量 影响 的 各 种 假设 ， 有 些 假设 似乎 是 相互 对 立 的 。 
这 些 假设 的 高 度 概括 的 说 明 与 其 对 应 的 量化 指标 在 表 23-1 中 显示 。 
表 23-1 ”组织 指标 概要 [5 























BR R tg ÈR 
一 份 代码 上 工作 的 人 越 多 ， 质 量 越 差 NOE 
团队 成 员 流 失 越 高 ， 知 识 流 失 率 也 越 高 ， 因 此 会 影响 质量 NOEE 
模块 修改 得 越 多 ， 稳 定性 越 差 ， 质 量 越 低 。 EF 
负责 人 层次 越 低 ， 质 量 越 好 DMO 
员工 越 集 中 (组织 结 构 上 ) ， 质 量 越 高 PO 
修改 代码 的 人 员 越 集中 ， 质 量 越 高 OCO 
接触 代码 的 人 员 越 分 散 ， 质 量 越 低 OOW 


接触 代码 的 组 织 越 多 ， 质 量 越 低 OIF 
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我 们 用 Vista 代 码 做 了 50 次 随机 切 分 , 得 到 了 图 23-2 中 的 数据 。 该 图 显示 了 预测 查 准 率 与 查 全 
率 的 一 致 性 和 连贯 性 。 数据 的 波动 很 小 , 表示 预测 模型 的 有 效 性 , 即 组 织 指标 能 够 预测 软件 质量 。 
查 准 率 与 查 全 率 分 别 为 86.2% 与 34%。 与 之 前 的 研究 相 比 ,这 是 我 们 得 到 的 最 高 查 准 率 与 查 全 率 。 
这 就 可 以 证 明 团 队 的 组 织 构架 是 预测 和 理解 软件 质量 的 一 个 重要 因素 。 因 为 组 织 构架 指数 比 代码 
指标 更 能 反应 出 代码 质量 。 同时 也 意味 着 建 并 适合 的 组 织 与 团队 构 染 十 分 关键 。 这 些 结 末 还 说 明 
了 组 织 构 架 对 于 质量 的 影响 以 及 重组 团队 的 计划 的 重要 性 ， 以 降低 其 对 产品 质量 的 负面 影 啊 。 
l 
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23.7 ”预测 缺陷 的 综合 方法 


e 我 们 已 经 单独 分 析 了 一 系列 度量 指标 , CLR ARE oe. AR, AAR R, 
。 在 本 区 中 我 们 将 讨论 如 何 综合 利用 这 些 度量 方法 ， 使 之 成 为 更 蝇 的 预测 缺陷 的 工具 。 

图 23- 3 展示 了 工程 师 们 工作 于 不 同 的 二 进 制 文件 的 简单 网 络 图 。 图 中 显示 了 不 同 网 络 之 辣 的 
代码 依赖 关系 。 该 图 在 一 个 网 络 中 整合 了 人 、 变 化 率 〈 修 改 /代码 页 献 人 代码 依赖 的 信息 。 


z A 
Y 





(a) 代码 贡献 网 络 





(b) 依赖 关系 网 络 





(c) 社会 -技术 网 络 
图 23-3 ”社会 -技术 网 络 图 


我 们 设计 了 这 样 一 个 网 络 来 集成 Windows Vista 中 人 、 代 码 变动 页 献 和 依赖 关系 的 信息 。 之 后 
会 介绍 几 个 社会 网 络 的 度量 方法 ， 用 它们 绘制 Windows Vista 的 社会 网 络 ” (类 似 于 图 23- 3), 

自我 网 络 度量 “基于 其 个 节点 的 邻居 。 被 评估 的 节点 表示 自我 ， 它 的 邻居 包括 自我 、 与 自我 
连接 的 市 点 以 及 这 些 市 点 之 则 的 所 有 边 。 


310 第 23 章 ，” 循 证 故障 预测 


e || [| [sizel 
目 我 网 络 中 的 市 把 数 。 
e [| [| [| ties[] 
网 络 中 所 有 连接 下 点 之 间 的 边 数 。 
e 0 UU pairs) 
个 体 关 系 网 络 中 可 能 存在 的 有 辣 边 的 个 数 。 
e OU 
实际 存在 的 边 相 对 于 可 能 存在 的 边 的 比率 (连结 /配对 )。 
ae He 
弱 关 联 模 块 的 数量 。 
*eHUUUUU 
用 规模 标准 化 的 弱 关 联 模块 〈 弱 关联 模块 数量 /规模 )。 
* UUU 
距离 自我 (ego) 不 超过 两 跳 的 市 点 比率 。 
eHUUU 
用 网 络 规模 标准 化 的 两 步 区 域 (到 达 效 率 高 意味 着 该 自我 的 主要 联系 人 在 网 络 内 影响 
很 大 )。 
e UOL 
仅 用 自我 连结 的 市 点 配对 数 GREE, AREI EATR AAE). 
*eHUUUUU 
用 配对 数 标准 化 中 间 人 。 
e |] U0 U0 U LU L betweenness[] 
个 体 在 个 体 关 系 网 络 中 的 中 介 度 。 
我 们 在 Vista 网 络 上 完整 计算 了 这 些 社会 网 络 指标 的 值 (包括 开发 人 员 、 代码 页 献 与 依赖 关系 )， 
并 用 这 些 指标 作为 输入 建立 预测 模型 。 我 们 发 现 如 果 配 合 使 用 代码 依赖 网 络 的 话 , 预测 的 查 准 率 与 
查 全 率 会 更 高 。IBM Eclipse 的 相关 实验 也 得 出 了 相似 的 结果 。 表 23-2 展 示 了 查 准 率 、 查 全 率 与 模 
型 拟 合 的 F 分 值 ， 也 说 明了 社会 -技术 网 络 能 更 好 地 预测 故障 。 表 23-2 中 的 “综合 模型 ”给 出 了 一 种 
只 结合 “页 献 ” 网 络 (团队 合作 ) 与 “依赖 网 络 ”( 依 赖 关系 ) 的 模型 ， 与 社会 一 技术 网 络 形成 对 
bh. 有 关 代 码 复 林 度 、 代 码 变动 、 代 码 履 盖 等 指标 联合 预测 故障 的 其 他 内 容 可 以 参照 参考 文献 [24]。 


表 23-2 社会 -技术 网 络 模 型 在 不 同 版 本 Eclipse 上 的 总 体 效 率 


























版 ”本 网 络 查 准 率 E 全 率 F-Score Nagel.” 
2.0 依赖 关系 网 络 0.667 0.779 0.705 0.532 
代码 贡献 网 络 0.808 0.854 0.824 0.702 


D Nagelkerke 决 定 系数 (Nagelkerke’s coefficient of determination) ， 统 计 学 中 ， 用 来 度量 统计 模型 多 大 程度 上 能 预测 
未 来 结果 的 一 个 参数 。 译 者 注 











( 续 ) 
版 ”本 网 络 查 准 率 查 全 率 F-Score Nagel. 
综合 网 络 0.826 0.814 0.813 0.909 
社会 技术 网 络 0.755 0.859 0.800 0.747 
2.1 依赖 关系 网 络 0.693 0.753 0.710 0.626 
代码 贡献 网 络 0.675 0.780 0.719 0.607 
综合 网 络 0.755 0.777 0.758 0.805 
社会 技术 网 络 0.747 0.809 0.770 0.689 
3.0 依赖 关系 网 络 0.631 0.737 0.673 0.494 
代码 贡献 网 络 0.681 0.683 0.673 0.353 
综合 网 络 0.745 0.756 0.743 0.616 
社会 技术 网 络 0.767 0.777 0.769 0.600 
3.1 依赖 关系 网 络 0.579 0.718 0.634 0.391 
代码 贡献 网 络 0.639 0.646 0.629 0.295 
综合 网 络 0.693 0.796 0.735 0.689 
社会 技术 网 络 0.820 0.800 0.806 0.668 
3.2 依赖 关系 网 络 0.698 0.780 0.731 0.495 
代码 贡献 网 络 0.614 0.720 0.654 0.371 
综合 网 络 0.835 0.866 0.846 0.816 
社会 技术 网 络 0.793 0.784 0.785 0.572 
3.3 依赖 关系 网 络 0.693 0.743 0.711 0.433 
代码 页 献 网 络 0.725 0.669 0.688 0.356 
综合 网 络 0.742 0.780 0.754 0.686 
社会 技术 网 络 0.820 0.831 0.823 Oy 


23.8 结论 


在 本 华中 我 们 基于 Windows 案 例 计 论 了 各 种 预测 故障 的 方法 。 表 23-3 总 结 I Windows Vista 
各 种 指标 预测 故障 的 查 准 率 与 查 全 率 。 


表 23-3 不 同 软 件 指标 模型 总 体 准确 率 





模 型 查 准 率 a 全 & 
组 织 结构 86.2% 84.0% 
代码 变动 78.6% 79.9% 
代码 复杂 度 79.3% 66.0% 
社会 网 络 /综合 指标 76.9% 70.5% 
依赖 天 系 74.4% 69.9% 


代码 覆盖 率 83.8% 54.4% 
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此 外 ,综合 儿 种 指标 得 出 的 社会 网 络 指标 也 能 够 正确 地 预测 故障 。 正 如 之 前 所 述 ， 所 有 实证 
研究 和 证 据 都 是 在 微软 搜集 的 ， 很 多 来 目 于 Windows 项 目 。 Hix E ARH a 于 其 他 软件 产品 
e en 人 有 有 在 不 MIRIA E 4 了 相似 的 测试 之 后 , 这 里 有 关 故 障 预测 的 证 据 才 能 被 证 明 

具有 还 是 具有 普遍 适用 性 。 请 参阅 补充 文章 “如 何 一 步 步 建立 质量 预测 器 ”” 。 本 章节 的 主要 目 
的 是 介绍 我 们 所 使 用 有 各 种 项 济 指标 ， 以 及 在 微软 个 案 中 得 到 的 结 未 和 经 难 。 我 们 希望 以 此 来 鼓 
励 研 究 者 在 其 他 项 目 中 重复 这 些 方法 ,分 析 检 验 它们 在 不 同 项 目 中 的 表现 。 














如 何 一 步 步 建立 质量 预测 器 


(1) 选择 所 研究 的 软件 已 。 卫 可 以 是 一 个 较 早 发 布 的 产品 ， 或 者 一 个 相似 项 目 。 

(2) 把 E 分 解 为 可 以 度量 质量 (二进制 文件 、 模 块 ) 的 一 个 个 实体 〈 子 系统 ， 模 块 ， 
文件 ， 类 ) E= fa :ee 

(3) 建立 一 个 方法 上 一 R ， 为 下 中 的 每 一 个 实体 设 定 一 个 质量 值 。 这 里 需要 参考 版 
本 与 缺陷 的 历史 数据 。 

(4) 建立 一 个 度量 方法 的 集合 M ={m,m,m 个， 其 中 每 一 个 mEM 是 一 个 映射 
Mm: 一 R， 为 每 一 个 eE R 设 定 一 个 度量 值 。M 需 要 根据 项 目 和 编程 语言 所 定 。 

(5) 对 于 每 一 个 me Mee  ， 定 义 m(e)。 

(6) 找 出 m(e) 与 defects(e) 的 关系， 以 及 m(e) 相互 之 间 的 联系 。 

(7) 如 果 需 要 ， 可 以 使 用 主 成 分 分 析 (principal component analysis) ， 找 出 主 成 分 集 
合 PC={pc,pc,, pc;…} ， 其 中 每 一 个 pc,€E PC ，Ppc =4cyc Cu)? < 

(8) 使 用 主 成 分 PC 为 已 ={fe'ee 建立 一 个 预测 器 。 同 时 评估 其 解释 力 与 预测 力 。 


本 革 中 的 指标 都 是 自动 采集 的 ,读者 们 也 可 以 用 商业 软件 工具 或 者 开源 集成 环境 中 的 工具 来 自 
动 得 到 相应 的 指标 。 图 23-4 "是 Microsoft Visual Studio 的 和 截图， 图 23-5” 是 IBM Eclipse 插件 的 截图 。 


Code Metrics Results ~a xX 


E] Filter: None > Al 


Hierarchy Maintainability Index Cyclomatic Complexity Depth of Inheritance Class Coupling Lines of Code 
z | Library - Debug (Library.dl) 119,81 31.00 3,00 27.67 63,33 
$$ <PrivateImplementationDetails >{SEOSBD25-B07F-42: 171.00 0.00 2.00 0.00 0.00 
J$ <Module > 171,00 0.00 1,00 0.00 0,00 
= 0 Lirary a 17,42 3.00 6,00 83.00 190,00 
di conte 17,42 $3.00 190,00 
9 EE A TT EEC 
sA ENa string, soy TOTE Sa 35.28 137,00 
Q .ctor{) 170,77 1.00 1.00 0.00 
=) 到 SimpleProgram - Debug (TestAssembly 1 .dl) 143,17 1.00 1.50 2.50 3.50 
$$ <Module> 171.00 0.00 1.00 0.00 0.00 
=- {} SimpleProgram 115.34 2.00 2.00 5.00 7.00 
= “$ Program 115,34 2.00 2.00 5.00 7.00 
9 Main(System. String[]): System, Void 101,33 3.00 4.00 15,00 
Q VerifyArguments(System. String[]):System,Bo 105,60 4.00 2.00 12,00 
$ .ctor() 170,77 1,00 1.00 0,00 





图 23-4 Microsoft Visual Studio “中 的 指标 报告 


Q@ 出 自 http:/blogs.msdn.comy/b/codeanalysis/archive/2007/02/28/announcing-visual-studio-code-metrics.aspX。2010 年 7 月 
13 日 获得 
© 出 自 http://metrics.sourceforge.net/。2010 年 7 月 13 日 获得 。 
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E Metrics - jnet.sourceforge,metrics wie x 

Metric Total] Mean} Std. Dev. | Maximum | Resource causing Maximum Method 全 

+ Number of Packages 16 

H Number of Methods (avgi/max per type) 1310 6.65 8,553 76 = Jnet.sourceforge, metrics/tgsrc/com/touchgrap.. . 

四 kgsrc 489 7.191 11,544 76 = jnet.sourceforge. metrics/tgsrc/com/touchgrap... 

Ese 761 6.238 6.553 45 jnet.sourceforge.metrics/src/net/sourceforge}... 
[+] net. sourceforge.metrics core sources 108 15.429 12.129 45 jnet sourceforge metrics/src/net/sourceforge}... 
[+] net. sourceforgs.metrics ui 7 9635 10.111 33 jnet. sourceforge. metrics/src/net/sourceforge/... 
[+] net. sourceforge.metrics core 198 6.6 7.093 27 = Jnet.sourceforge, metrics/src/net/sourceforge/... 
+|net.sourceforge.metrics ui. preferences 52 6.5 7.467 26 jnet.sourceforge. metrics/src/net/sourceforge;.... 
+|net. sourceforge. metrics ui. dependencies % 5.588 3.727 15 jnet sourceforge. metrics/src/net/sourceforge/.... 
+lnet.sourceforge.metrics internal. persistence 18 4.5 4.33 12 jnet. sourceforge. metrics/src/net/sourceforge/... 
[+] net. sourceforge.metrics internal prevayler implementa... 54 5.4 2.871 10 Jnet.sourceforge, metrics/src/net/sourceforge/... 
[+] net. sourceforge.metrics internal, xml 41 4.1 2.022 9 jnet. sourceforge. metrics/src/net/sourceforge;.... 
[+] net. sourceforge.metrics calculators 79 4158 2.254 B jnet.sourceforge. metrics/src/net {sourceforge}... 
+) net.sourceforge.metrics propagators 31 5.167 1.067 7 jnet. sourceforge. metrics/src/net/sourceforge;... 
+|net.sourceforge.metrics internal tests 8 2.667 1.686 4 jnet,sourceforge,metrics/src/net/sourceforge),,. 
+/net. sourceforge.metrics internal prevayler 0 0 0 

[+] classycle 60 868.571 2.556 13 {net sourceforge, metrics/classyclefclassycle/g... 

HE Lines of Code (avg/max per type) 6593 33.467 49.02 339 jnet sourceforge metrics/tgsrc/com/touchgrae..,. 

E Number of Interfaces (avg/max per packagePragment) 16 i 1,414 4 /net.sourceforge, metrics/arc/net/sourceforge/... 

[=| Lines of Code (avg/max per method) 6593 4812 7.355 69 /net.sourceforge.metrics/classyclefclassycle/g... caleulsteAttributes 
[+) classycle 324 5.4 9.94 69 /net.sourceforge.metrics/classyclofelassycle/g,.. calculateAttributes 
[E tgsrc 2321 4.661 8.278 59 {net sourceforge. metrics/tgsrc/com/touchgrap.,. scrollselectPanel 
H src 3948 4.862 6.473 52 jnet sourceforge. metrics/erc/net/sourceforge/.,. setMetrics 

[=]net. sourceforge.metrics ui 544 6.8 8.707 52 jnet sourceforge, metrics/srcjnet/sourceforge/.,. settletrics 
=| MetricsTable, java 194 0.776 13.831 52 /net.sourceforge. metrics/src/net/sourceforge/.,. setMetrics 
H Metrics T able 194 0.778 13.831 52 |net.sourceforge.metrics/src/net/sourceforge/... setMetrics 
setMetrics 52 P- 
4 | | + 
T 
图 23-$ IBM Eclipse 的 指标 插件 
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RANE, 有 的 孩子 还 把 捉 到 的 虫子 作为 战利品 放 在 甸子 里 面 收藏 起 来 , 那 可 是 他 们 
的 珍宝 。 经 过 了 一 段 时 间 ， 护 子 们 可 以 收集 到 大 量 各 种 各 样 不 同 种 类 的 虫子 。 有 些 骇 子 会 研究 目 
己 搜 集 的 虫子 ， 并 且 根 据 它 们 的 特征 ， 比 如 形状 、 大 小 、 颜 色 、 脚 的 数量 、 是 否 会 他， 来 标识 它 
们 。 孩 子 们 对 虫子 的 珍视 程度 也 因为 它们 各 自 的 稀有 程度 和 捕获 的 难度 而 有 所 不 同 。 收藏 可 能 存 
在 重复 ,但 古 即使 十 重复 的 虫子 也 不 会 是 一 模 一 样 的 ， 因 为 外 形 和 大 小 的 革 别 会 很 大 。 

可 是 作为 程序 员 的 我 们 却 不 喜欢 虫子 (bug ) 。 我 们 希望 软件 里 面 没 有 缺陷 ， 如 采 有 的 话 ， 
一 旦 找到 就 要 把 它们 消灭 掉 ! 但 不 斑 的 是 ,消灭 缺陷 (更 客气 的 说 法 ， 回 应 软件 修改 请 求 ) 并 不 
古人 简单 的 事情 。 程 序 员 们 必须 仔细 研究 缺陷 相关 的 问题 ， 针 对 如 何 解 决 缺陷 做 一 个 彻底 的 调查 ， 
检验 它 的 副作用 ,最终 决定 如 何 采 取 行动 并 付 诸 于 实施 。 这 是 一 个 困难 的 任务 ,就 和 世上 的 虫子 
一 样 ， 软 件 缺陷 也 各 种 各 样 。 通 稍 在 项 目 缺 陷 数 据 库 中 的 缺陷 是 被 单独 研究 的 ， 因 为 与 其 他 缺陷 
相 比 ， 它 们 对 整个 软件 系统 的 影响 ， 以 及 它们 的 起 因 、 位 置 、 严 重 程度 都 不 同 。 经 过 一 段 时 间 ， 
项 目 中 会 发 现 重复 的 缺陷 ,就 好 像 收 集 到 的 虫子 中 同一 种 类 的 会 有 好 多 个 。 最 终 ， 儿 乎 每 一 个 项 
目的 缺陷 都 会 多 到 来 不 及 修复 ， 正 如 虫子 太 多 一 个 人 抓 不 过 来 一 样 。 

所 以 软件 缺陷 的 研究 是 值得 好 好 化 一 些 时 间 的 。 而 其 中 的 第 一 步 束 是 对 缺陷 报告 中 报告 
者 提供 信息 的 研究 。 本 革 中 ， 我 们 将 讨论 优秀 缺陷 报告 需要 具备 的 要 素 ， 以 及 搜集 缺陷 报告 
的 意义 。 


24.1 ”缺陷 报告 的 优 务 之 分 


当 用 户 在 软件 系统 中 磁 到 一 个 缺陷 时 ,他 们 会 汇报 给 开发 人 员 , 希望 尽快 将 这 个 缺陷 修复 。 开 
发 人 员 从 缺陷 报告 中 提供 的 信息 来 仔细 了 解 式 个 问题 ， 第 第 也 受 这 些 信息 的 局 发 找到 缺陷 的 源头 。 

但 是 缺陷 报告 的 信息 质量 和 详细 程度 动 各 有 不 同 。 让 我 们 看 一 下 Eclipse 项 目 中 编写 为 #31021 
的 缺陷 报告 。 
































O bug 在 软件 工程 里 面 意味 着 软件 缺陷 。 一 一 译 者 注 
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I20030205 
执行 下 列 代码 。 双 击 目录 树 上 的 一 项 ， 它 没有 展开 。 
注释 掉 选 择 监 听 器 的 代码 ， 然 后 双击 目录 树 上 的 一 项 ， 它 才 展 开 。 


public static void main(String[] args) { 
Display display = new Display(); 
Shell shell = new Shell (display); 
[. . . ] (21 lines of code removed) 
display.dispose(); 

} 


报告 者 提交 了 一 份 代码 范例 , 仔细 说 明了 如 何 运行 这 份 代码 来 重 现 这 个 缺陷 。 一 旦 程序 员 重 
现 并 观 罕 到 了 这 个 缺陷 ， 人 研究 其 产生 原因 可 能 会 方便 很 多 。 

在 男 一 方面 ,下面 一 份 缺 陷 报 告 也 来 自 Eclipse 项 目 (#175222), 事实 上 它 本 身 不 是 一 个 缺陷 ， 
AN FE HEAR BA o 


我 想 在 Eclipse 中 用 CDT 创 建 一 个 新 的 插件 。 这 当然 是 可 能 的 。 我 已 经 在 Eclipse 文档 
生成 了 一 个 RD 文件 。 我 知道 如 何 使 用 Java 创 建 一 个 插件 。 但 是 ,我 想 用 CDT 创 建 一 个 新 
的 插件 (用 户 定义 插件 ) ， 然 后 自己 用 程序 实现 。 这 可 能 吗 ? 谁 来 帮助 我 一 下 。 


缺陷 报告 中 的 信息 质量 可 以 严重 影 啊 一 个 问题 的 解决 以 及 解决 它 所 用 的 时 间 。 缺陷 报告 如 来 
含有 所 有 的 必要 信息 ， 可 以 在 一 定 程度 上 降低 修复 该 缺陷 的 难度 。 与 此 相反 ， 缺 陷 报告 中 的 信息 
不 充分 可 能 会 延迟 缺陷 修复 , 因为 开发 人 员 需 要 目 己 找 出 缺失 的 信息 或 者 联系 提交 者 以 便 狄 得 更 
多 信息 。 


24.2 ”优秀 缺陷 报告 需要 具备 的 要 素 


通过 网 上 问卷 调查 ， 我 们 询问 了 150 名 开发 人 员 怎 样 的 缺陷 报告 会 帮助 他 们 解决 缺陷， 他 们 
分 别 来 自 三 个 最 大 也 是 最 成 功 的 开源 项 目 (Apache、 Eclipse 以 及 Mozilla)。 我 们 还 询问 了 缺陷 报 
告 者 在 缺陷 报告 中 提供 了 哪些 信息 ， 哪 些 信息 古 好 难 提供 的 。 

调查 结 琳 如 表 24-1 中 所 示 。 和 针对 开发 人 员 的 调查 包括 以 下 两 类 问题 。 

e DOUDO0UD0U0UUUUD 

O (D1) 开发 人 员 使 用 了 下 列 选 项 中 的 哪些 来 修复 缺陷 ? 
O (D2) 哪 三 个 信息 对 开发 人 员 的 帮助 最 大 ? 
这 个 问题 的 答案 可 以 辅助 人 们 开发 工具 或 编写 指责 来 帮助 报告 者 在 缺陷 报告 中 提供 开发 

人 员 需 要 的 详细 信息 。 我 们 为 开发 人 员 提 供 了 16 个 选项 ， 一 些 是 来 自 Mozilla 缺 陷 撰写 指南 ， 

还 有 一 些 来 自 Bugzilla 数 据 库 中 找到 的 标准 属性 。 对 于 第 一 个 问题 (D1)， 开 发 人 员 可 以 自由 

地 选择 ， 没 有 数量 的 限制 。 第 二 个 问题 (D2) 最 多 选择 三 项 ， 以 体现 他 们 选择 的 重要 性 。 








© Mozilla 缺 陷 撰写 指南 描述 了 有 效 缺 陷 报 告 的 准则 〈 比 如 准确 、 清 晰 、 每 个 报告 说 明 一 个 缺陷 等 )， 并 且 列 出 了 对 
每 个 缺陷 报告 都 尤为 重要 的 一 些 信息 ， 比 如 重 现 的 步 又、 实际 结果 、 期 望 结 果 ”。 
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*HUUUUUUUUUUO 

O (D3) 开发 人 员 在 修复 缺陷 中 遇 到 哪些 问题 ? 

O (D4) 在 修复 缺陷 中 ， 大 多 数 延 丸 是 由 哪 三 大 因素 引起 的 ? 

我 们 问 这 些 问 题 的 动机 古 为 了 找到 开发 人 员 所 面临 的 突出 障碍 , 以 便 日 后 更 加 小 心地 对 
待 这 些 同 题 ， 其 至 实现 自动 化 报告 缺陷 。 典 型 问题 如 : 缺陷 报告 中 提供 了 不 正确 的 信息 ， 比 
如 错误 的 操作 系统 。 

缺陷 报告 的 其 他 问题 包括 语言 使 用 问题 (模糊 )， 重 复 缺 陷 以 及 不 完整 的 信息 。 最 近 垃 
圾 缺陷 函件 也 成 了 一 个 同 题 ， 特 别 在 TRAC 四 题 跟踪 系统 中 。 我 们 这 里 不 讨论 把 缺陷 指派 给 
背 误 的 开发 人 员 ， 因 为 缺陷 汇报 者 对 缺陷 分 类 的 影响 很 小 。 总 的 来 说 ， 我 们 为 开发 人 员 提 供 
了 21 个 选项 。 对 于 第 三 个 问题 (D3) ， 我 们 一 再 强调 ， 开 发 人 员 的 选择 数目 是 不 受 限制 的 。 
但 对 于 第 四 个 问题 ， 选 择 限于 三 个 。 表 24-1 包 含 了 所 有 选项 。 

我 们 问 了 缺陷 报告 者 三 个 问题 ， 分 成 以 下 的 两 类 (请 参阅 表 24-1)。 
*HUUUUUUU 

O (R1) 报告 者 在 报告 缺陷 时 提供 了 哪些 信息 ? 

O (R2) 哪 三 个 信息 最 难 提供 的 ? 

我 们 提供 给 报告 者 的 16 个 选项 与 所 供给 开发 人 员 的 一 致 。 这 是 为 了 检查 报告 者 提供 的 信 
息 是 否 与 开发 人 员 经 常 使 用 的 或 者 他 们 认为 重要 的 信息 一 致 (通过 比较 D1、D2 与 R1 的 回答 )。 
第 二 个 问题 帮助 我 们 发 觉 哪些 问题 是 很 难 收集 的 , 哪些 工具 可 以 更 好 地 用 来 帮助 解决 这 些 癌 
题 。 在 Rl 中， 报告 者 的 选择 不 受 限制 但 R2 问 题 的 选择 限制 在 三 个 之 内 。 
*HUUUU 

O (R3) 哪 三 个 信息 是 报告 者 认为 对 于 开发 人 员 来 说 最 重要 的 信息 ? 

这 里 的 选项 也 与 提供 给 开发 人 员 的 一 致 ,用 来 检查 报告 者 与 开发 人 员 想 法 是 否 一 致 〈 比 
较 D2 与 R3 的 答案 )。 对 于 这 个 问题 (R3)， 报 告 者 至 多 可 以 选择 三 个 答案 ， 但 可 以 选择 任何 
选项 ， 无 论 他 们 有 是 人 否 已 经 在 R1 中 选择 了 这 些 选 项 。 


此 外 ， 对 于 开发 人 员 与 缺陷 报告 者 ， 我 们 都 询问 了 他 们 与 缺陷 报告 相关 的 想法 和 经 验 (DS 




















与 R4) 。 


表 24-1 给 Apache、Eclipse 和 Mozilla 开 发 人 员 (Dx)〉 和 缺陷 报告 者 (Rx) 的 问卷 


缺陷 报告 内 容 D1: 你 使 用 了 下 列 选 项 中 哪些 来 修复 缺陷 


D2: 哪 三 个 选项 对 你 的 帮助 最 大 

R1: 你 在 报告 缺陷 时 提供 了 哪些 选项 

R2: 哪 三 个 选项 最 难 提供 的 

R3: 你 认为 哪 三 个 选项 对 开发 人 员 修复 缺陷 最 重要 





o 严重 程度 





0 build 信 息 





O 栈 跟踪 信息 


O 产品 信息 O 硬件 信息 O 观察 到 的 行为 O 截图 
O 组 件 信 息 O 操作 系统 信息 O 期 望 行为 O 代码 范例 
O 版 本 号 0 总 结 O EMPR O 错误 报告 





O 测试 用 例 














( 续 ) 
缺陷 报告 的 间 题 。 “D3: 你 在 修复 缺陷 中 遇 到 哪些 问题 
D4: 大 多 数 缺 陷 修复 的 延迟 是 由 哪 三 大 因素 引起 的 
已 有 信息 存在 错误 的 信息 在 于 ”报告 者 使 用 了 其 他 
O 产品 信息 o 代码 范例 D 语法 错误 D 重复 错误 
D 部 件 信息 Oo 重 现 步 又 D 没有 条 理 的 描述 O 垃圾 函件 
D 版 本 号 D 测试 用 例 O 随意 的 描述 D 不 完整 的 信息 
D 操作 系统 信息 。 口 本 跟踪 信息 D 描述 过 长 D 病毒 、 蠕 由 
D 观察 到 的 行为 O 非 技术 语言 
D 期 望 行为 O 拼写 错误 
评论 D4/D5 欢 迎 分 享 你 关于 缺陷 报告 的 意见 与 经 验 





24.3 ”调查 结果 


图 24-1 是 开发 人 员 的 调查 结果 ， 图 24-2 是 缺陷 报告 者 的 调查 结果 。 

图 中 , 每 一 项 的 调查 结果 用 横 条 来 表示 《村上 ), 其 含义 解释 如 下 (用 D1 与 D2 作为 例子 ): 

口 有 颜色 部 分 (m+) 表示 该 选项 在 D1 中 被 选择 的 次 数 ， 

O 黑色 的 部 分 表示 该 选项 在 D1 与 D2 问题 都 被 选中 的 次 数 。 

黑色 比 灰色 的 比率 越 大 , 表示 该 选项 对 于 开发 人 员 越 重要 。 每 一 个 选项 的 重要 性 在 括号 内 表 
示 ， 比 如 在 图 24-1 中 ， 开 发 人 员 认 为 重 现 缺陷 的 步 又 (m, 83%) 比 build 信 息 (GS, 
8%) 更 加 重要 。 


24.3.1 开发 人 员 眼 中 的 缺陷 报告 内 容 


如 图 24-1 所 示 ， 对 于 各 类 项 目 ， 最 闸 使 用 的 信息 包括 重 现 缺陷 步 台 ， 观 罕 到 的 行为 与 预期 行 
为 ， 栈 跟踪 信息 和 测试 用 例 。 最 不 第 补 开 发 人 员 使 用 的 项 目 包括 硬件 信息 与 严重 程度 。Eclipse 
与 Mozilla 的 开发 人 员 比较 喜 欢 截图 , 而 Apache 与 Eclipse 的 开发 人 员 则 更 喜欢 用 代码 范例 与 栈 跟 踩 
言 息 。 

显 而 多 见 ， 重 现 缺 陷 的 步骤 是 节 重 要 的 信息 。 其 后 是 栈 跟踪 信息 与 测试 用 例 ， 可 以 用 它们 缩 
小 导致 仙 陷 的 代码 范围 。 观 察 到 的 行为 与 重 现 缺陷 步骤 类 似 ， 也 较为 重要 。 规 图 虽然 也 被 认为 相 
SH, (LE AMAT Hm Bie PRIA 

其 他 一 些 信 息 的 重要 性 相对 来 说 较 低 ， 比 如 期 望 行为 、 代 码 范 例 、 总 结 以 及 一 些 必 须 填 写 的 
音 息 比如 版 本 号 、 操 作 系 统 、 产 品 和 硬件 信息 。 正 如 Mozilla 开 发 人 员 所 认为 的 那样 ， 并 不 是 所 有 
的 项 目 都 需要 用 到 这 些 信息 : 


“因为 我 们 项 目的 很 多 缺陷 出 现 于 各 种 平台 ， 所 以 产品 信息 ， 其 至 部 件 信息 都 是 无 
用 的 ， 在 一 定 程度 上 硬件 与 操作 系统 信息 也 是 不 需要 的 。 
无 论 如 何 ， 我 们 要 谨慎 地 解释 这 里 的 结 末 。 在 调查 中 重要 性 低 的 信息 并 非 完 全 无 用 , 我 们 可 
能 仍然 需要 它们 来 理解 、 重 现 、 鉴 别 缺陷 。 
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缺陷 报告 的 内 容 (D1/D2): 括号 内 为 重要 度 


Co inte (5%) 
CS 组件 信息 (3%) 
oT Nik 45-12%) 
ECI EEEO) 


EED 观察 到 的 行为 (33%) 
ED 期 望 行为 (22%) 
D 重 现 步 又 (83”%0) 
ED 栈 跟 踪 信 息 (57%) 


缺陷 报告 中 的 问题 (D3/D4) 
已 知 信息 3 
一 田产 品名 称 (7%0) 


EL HAER (15%) 
E kE (22%) 
OC 硬件 信息 (8%) 
CF 操作 系统 信息 (20%) 
E ARR TA (48%) 
EE HBA AT) 


报告 者 错误 : 
上 号 语法 错误 (16%) 


其 [了 J 没有 条 理 的 描述 (34%) 


CF hf (18%) 
Mo iit (26%) 
Gr 站 技术 语言 (19%) 
Go 拼写 错误 (0%) 


天 [十 硬件 信息 (0%) 
Go 操作 系统 信息 (4%) 
ED 总 结 (13%) 
Go build 信 息 (8%) 


a 4.41 (26%) 

代码 学 例 (149%0) 
上 错误 报告 (12%) 
E 测试 用 例 (51%) 


错误 存在 于 : 

世代 码 花 例 (15%) 
ED 重 现 步 又 (79%0) 
ix fi (38%) 
OC tk Rea (25%) 


其 他 : 

上 于 J 重复 错误 (10%) 
匡 一 十 垃圾 函件 (0%) 
MD 不 完整 的 信息 (74%) 
[一 一 病毒、 蠕虫 (0%) 





图 24-1 开发 人 员 调 查 结果 (130 份 来 自 Apache、Eclipse 与 Mozilla 开 发 人 员 的 可 靠 调查 反馈 ) 


24.3.2 ”报告 者 眼中 的 缺陷 报告 内 容 


图 24-2 的 第 一 部 分 是 报告 者 提供 的 信息 。 和 预测 的 一 样 ， 观 罕 到 的 行为 与 预期 行为 以 及 重 现 
缺陷 的 步骤 是 前 三 甲 。 只 有 少 部 分 用 户 在 缺陷 报告 中 加 入 了 栈 跟 踩 信息 ， 代 码 邯 例 和 测试 用 例 ， 
原因 可 能 古 因 为 人 们 很 难 提供 这 些 信息 , 括号 内 的 数字 表示 难度 , 是 调查 对 象 选 择 该 项 目 难 以 提 
供 的 比率 。 栈 跟踪 信息 ， 代 码 范 例 和 测试 用 例 钙 最 难 提 供 的 三 个 信息 ， 以 测试 用 例 为 首 。 出 人 和 意 
料 的 古 ， 重 现 缺 陷 的 步 又 与 部 件 信 息 也 较 难 提供 。 对 于 部 件 信 息 ， 报告 者 在 注释 中 指出 他 们 常 第 
很 难 确认 人 缺陷 是 在 哪 一 部 件 中 发 生 的 。 

在 报告 者 认为 对 开发 人 员 最 有 帮助 的 信息 中 , 重 现 缺 陷 的 步骤 与 测试 用 例 排 名 最 高 。 比 较 讽 
试用 例 在 三 个 问题 中 的 结 采 后 发 现 绝 大 多 数 报告 者 认为 它 是 十 分 重要 的 , 但 只 有 少数 报告 者 提供 
了 该 消 上 甩 ， 因 为 它 很 难 提供 。 这 局 发 我 们 可 以 将 记录 捕获 、 重 播 测试 用 例 的 工具 整合 入 缺陷 跟踪 
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系统 中 。 栈 跟踪 信息 也 有 类 似 的 情况 ， 它 们 多 数 隐 藏 在 日 志 中 ， 很 难 找到 。 兄 一 方面 ， 开 发 人 员 
与 报告 者 都 认为 部 件 信息 是 次 要 的 ， 而 且 很 难 提供 。 


缺陷 报告 内 容 (RI/R2) 括号 内 为 困难 程度 

ED 产品 信息 (0%) Ca te iz. E (1%) 
ED 组 件 信息 (22%) ED 操作 系统 信息 (1%) 
ED kE (1%) EED 48 (4%) 

Ga i HEE (5%) Co builds. (3%) 


a 观察 到 的 行为 (2%) E (8%) 
aa 期 望 行为 3%) 国志 代码 范例 (43%) 
D 重 现 步 又 (51%) ET) 错误 报告 (2%) 
ot 栈 跟 踪 信 息 (24%) SD) iA Bil (75%) 


对 开发 人 员 最 关键 的 内 容 (R3) 

括号 内 为 问题 R3 中 各 项 出 现 频率 

本 一 二 产品 信息 (7%) [硬件 信息 (0%) 
Co Aria (4%) 本 一 十 操作 系统 信息 (4%) 
下 二 版 本 3 (12%) 本 一 总结 (6%) 

C—O PEER) 区 一 build{à E (8%) 


ELC i BIT (33%) TIRK (5%) 
Go 期 望 行为 (22%) 区 一 田代 码 沱 例 (9%) 
ED 重 现 步骤 (78%) CO HIRE (9%) 
Gr) 栈 跟 中 信息 (33%) Cr ili FG (43%) 








图 24-2 ”报告 者 的 调查 结 末 〈215 份 来 自 于 Apache、Eclipse 和 Mozila 的 报告 者 的 可 靠 癌 卷 反 馈 ) 


244 来 自 不 一 致 信息 的 证 掘 
我 们 比较 了 开发 人 员 与 报告 者 的 调查 结果 , 来 查看 两 方面 对 于 缺陷 报告 中 的 重要 部 分 的 看 法 


征 否 一 致 。 

首先 ， 我 们 比较 开发 人 员 用 来 解决 缺陷 的 信息 (问题 D1) 与 报告 者 提供 的 信息 (R1)。 在 图 
24-3 中 ,无 列 是 降序 排列 的 开发 人 员 使 用 该 信息 的 百分比 ， 右 列 是 降序 排列 的 报告 者 提供 该 信息 
的 百分比 。 两 列 中 的 相同 项 目 用 线 连接 起 来 , 显示 该 项 目 在 开发 人 员 和 报告 者 两 方面 的 一 致 与 个 。 
图 24-3 中 显示 只 有 前 三 个 信息 以 及 最 后 一 个 信息 一 致 。 中 间 的 都 不 一 致 ， 而 其 中 栈 跟踪 信息 、 测 
WAAL ARISE hl, pinta. REARS RADE. BAK, FRA MEHE BSR 
提供 信息 之 间 的 斯 皮尔 曼 等 级 相关 系数 ”(Spearman correlation) 是 0.321， 远 非 理想 值 。 








O 斯 皮尔 曼 等 级 相关 系数 衡量 两 个 变量 之 间 关 联 强 度 ， 从 -1 到 +1。 如 来 值 趋 近 于 1 或 者 -1， 表 明 关 联 紧密 ， 如 末 等 
于 0， 则 表示 没有 关联 。 加 减 号 表示 是 正 向 关联 还 是 逆向 关联 。 
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然后 ， 我 们 检查 了 报告 者 是 否 担 供 了 开发 人 员 认 为 最 重要 的 信息 。 图 24-4 中 ,无 列 对 应 开发 
人 员 认 为 重要 的 信息 〈 辣 题 D2 与 D1 的 答案 )， 右 列 对 应 报告 者 提供 该 信息 的 百分比 〈R1)。 开 发 
人 员 与 报告 者 在 第 一 项 与 最 后 一 项 依然 一 致 , 但 是 总 的 来 说 不 一 致 性 增加 了 。 这 里 的 斯 皮尔 曼 等 
级 相关 系数 是 -0.03， 表 示 开 发 者 认为 重要 的 信息 与 报告 者 提供 的 信息 之 间 有 巨大 的 差异 。 特 别 
是 报告 者 没有 关注 开发 人 员 认 为 重要 的 信息 。 


开发 人 员 
期 望 行为 (94%) 
测试 用 例 (85%) 版 本 号 (91%) 
总 结 (81%) 
截图 (75%) 
版 本 号 (75%) 组 件 信 息 (87%) 











代码 范例 (68%) *: 严重 程度 (77%) 


组 件 信息 (67%) X J miake _ 
PNEC X 
ran oo PL \ 
操作 系统 信息 (63%) 
build 信 息 (62%) 栈 跟踪 信息 (50%) 
FERE GTO 
EERE CH 


图 24-3 ”开发 人 员 使 用 的 信息 对 比 报告 者 提供 的 信息 








有 意思 的 是 ， 图 24-5 显 示 了 大 多 数 报告 者 清楚 开发 人 员 的 需求 。 换 句 话说 ,报告 者 之 所 以 没 
有 提供 这 些 信息 并 不 古 因 为 他 们 不 知道 。 与 之 前 的 图 例 相 一 致 ， 左 列表 示 开 发 人 员 眼 中 该 信息 的 
重要 性 ， 右 列表 示 报 告 者 眼中 该 信息 的 相关 性 (问题 R3)。 两 部 分 基本 上 一 致 ， 只 有 截图 一 项 出 
入 较 大 。 这 里 的 斯 皮尔 曼 等 级 相关 系数 是 0.839， 这 也 肯定 了 开发 人 员 与 报告 者 对 于 大 部 分 信息 
的 重要 程度 征 有 共 识 的 。 

总 体 而 言 ， 为 了 改进 缺陷 跟踪 系统 ， 人 们 可 以 告诉 用 户 哪 些 信 息 是 重要 的 (比如 截图 )。 同 
时 ， 系 统 应 该 提供 更 强大 的 工具 来 采集 重要 信息 ， 因 为 这 些 信息 用 户 和 常常 很 难 獒 得 。 
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开发 人 员 报告 者 


期 望 行为 (94%) 
产品 信息 (94%) 
A Bea 
Te 
代码 范例 (14%) 总 结 (90%) 
ET x 
ET 
错误 报告 (12%) 人 build 信息 (60%) 
build 信息 (8%) P; y 截图 (60%) 
anon |/ 
操作 系统 信息 (4%) 
组 件 信息 (3%) 栈 跟踪 信息 (50%) 
a | memeo 
PEREO 


图 24-4 ”开发 人 员 认 为 最 重要 的 信息 对 比 报告 者 最 经 党 提供 的 信息 











24.5 ”缺陷 报告 的 问题 


在 开发 人 员 目 前 过 到 的 所 有 问题 中 ,最 第 见 的 古 信 息 不 完整 。 其 他 普遍 问题 包括 重 现 缺陷 步 
又 有 和 错误， 测试 用 例 出 错 ， 重 复 的 缺陷 ， 不 正确 的 版 本 信息 ， 观 察 到 的 行为 和 预期 行为 不 准确 。 
男 一 个 让 开发 人 员 头 痛 的 问题 是 报告 者 的 语言 熟练 程度 。 这 些 癌 题 邦 会 在 修复 缺陷 时 轻易 误导 
发 人 员 。 

最 严重 的 问题 就 古 重 现 缺 陷 步 又 中 的 错误 以 及 不 完整 的 信息 。 事 实 上 ， 在 D5 问题 中 ,很 多 
开发 人 员 才 表示 曾经 因为 缺陷 报告 中 的 信息 不 完整 而 受 折磨 。 有 一 位 开发 人 员 这 样 写 道 : 

“导致 延误 的 最 大 原因 不 是 错误 的 信息 ， 而 是 不 完整 的 信息 。 ” 


我 们 对 于 垃圾 函件 出 现 的 低频 率 并 不 是 很 意外 ， 因 为 在 Bugzilla 与 Jitra 中 ,报告 者 需要 注册 之 
后 才能 提交 缺陷 报告 , 注册 过 程 成 功 地 防止 了 垃圾 报告 。 最 后 , 栈 跟踪 信息 出 错 的 可 能 性 非常 低 ， 
因为 它们 大 部 分 征 直 接 复 制 粘贴 至 缺陷 报告 的 ， 不 过 如 采 一 旦 出 错 ， 就 会 导致 严重 问题 。 

男 一 些 重要 问题 在 于 测试 用 例 与 观察 到 的 行为 中 的 错误 。 有 苇 思 的 是 ,重复 的 缺陷 并 没有 十 
分 困扰 开发 人 员 ， 尽 管 早期 的 研究 认为 它 会 是 一 个 问题 “。 也 许 开发 人 员 可 以 轻易 地 识别 重复 的 
缺陷 ， 划 至 得 益 于 对 同一 问题 的 另 一 种 描述 。 下 一 未 将 讨论 重复 缺陷 报告 的 价值 。 
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开发 人 员 
重 现 步 又 (83%) 重 现 步骤 (78%) 
栈 跟 踪 信 息 (57%) 测试 用 例 (43%) 


测试 用 例 (51%) 观察 到 的 行为 (33%) 


观察 到 的 行为 (33%) 栈 跟踪 信息 (33%) 


MATA (22%) 
PER I3%) 错误 报告 (9%) 
错误 报告 02%) 信息 (7) 

build 信 息 8%) | E 
信息 (65%) 0 
操作 系统 信息 4%) 组 件 信息 4%) 

组 件 信息 (3%) 操作 系统 信息 (4%) 
硬件 信息 (0%) 严重 程度 2%) | 
硬件 信息 (0%) 


图 24-5 ”开发 人 员 认 为 最 重要 的 信息 对 比 报告 者 认为 最 重要 的 信息 
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津 见 的 反对 重复 缺陷 报告 的 观点 是 ,它们 会 极 大 消耗 缺陷 跟踪 系统 的 资源 , 并 且 和 需要 质量 你 
证 团队 投入 更 多 的 精力 ， 而 这 些 精 力 本 可 以 投入 到 其 他 改进 产品 的 工作 中 。 本 三 中 ,我 们 会 给 出 
与 这 一 观点 对 立 的 实证 研究 的 证 据 : 重复 缺陷 报告 中 其 实 含有 额外 的 信息 ， 有 利于 缺陷 修复 。 

当 一 个 缺陷 报告 被 认为 是 重复 的 ,我 们 通 第 的 处 理 办 法 古 将 该 缺陷 关闭 ,并 且 信 息 会 被 删除 。 
这 种 做 法 长 期 而 言 会 对 用 户 提 交 缺 陷 报 告 起 到 消极 作用 。 当 他 们 看 到 一 个 缺陷 报告 已 经 被 提交 过 
之 后 ， 他 们 不 再 愿意 提供 额外 的 信息 : 


通 第 ， 我 报告 的 缺陷 已 经 被 能 力 不 济 的 家 伙 提 交 过 ， 而 且 报告 得 十 分 糟糕 ， 缺 少 
重要 信息 。 当 我 花车 很 长 时 间 编 写 的 十 分 详尽 的 缺陷 报告 被 标注 是 重复 报告 时 ,我 感到 











并 不 是 所 有 人 都 认为 重复 缺陷 报告 是 无 益 的 。 我 们 的 调查 发 现 有 几 位 开发 人 员 指 出 重复 缺陷 
对 于 修复 缺陷 的 益处 : 


“重复 缺陷 报告 并 不 一 定 就 是 麻烦 。 它 们 经 第 能 提供 额外 的 有 用 人 信息。 虽然 在 另 一 
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份 缺 陷 报告 中 提交 这 些 信息 不 是 理想 的 做 法 。 
“最 好 能 够 修改 报告 ， 而 不 是 注销 一 份 很 棒 的 报告 只 是 因为 在 它 之 前 已 经 有 了 一 份 
差劲 的 缺陷 报告 。 这 样 会 对 软件 工程 师 更 加 有 益 。 ” 


微软 的 一 位 测试 构架 师 Alan Page 有 相似 的 观点 ， 对 于 “为 什么 没有 必要 担忧 重复 的 缺陷 ”他 
总 结 了 三 点 原因 站。 
O 提交 重复 缺陷 报告 对 用 户 通 稼 都 会 有 负面 影响 。 他 们 会 变 得 不 愿 报告 缺陷 ， 即 使 那个 缺 
陷 还 没有 被 提交 过 。 
O 鉴别 人 员 比 用 户 更 擅长 鉴别 重复 的 缺陷 ， 他 们 也 更 加 熟悉 系统 。 we 
很 长 时 间 来 浏览 类 似 的 缺陷 ， 但 鉴别 人 员 只 需要 儿 分 钟 就 能 知道 一 个 缺陷 是 否 重 
口 重复 缺陷 可 以 提供 有 价值 的 信息 来 帮助 诊断 出 真正 的 问题 。 





重复 缺陷 芮 的 捉 供 了 额外 的 信息 吗 ? 提供 了 多 少 呢 ? 我 们 的 实证 研究 将 给 出 答案 ai 我 
们 建立 了 一 个 工具 来 检测 和 量化 信息 ， 比 如 缺陷 报告 中 的 补丁 、 截 图 和 栈 跟踪 信息 。 下 一 步 , 我 
们 比较 原始 缺陷 报告 〈 称 为 主 报告 ) 和 扩展 报告 中 的 信息 。 扩 展 报 告 中 的 信 . an 告 与 其 


他 重复 报告 中 的 信息 

表 24-2 为 我 们 在 Eclipse 项 目 中 的 发 现 。 第 一 列 为 “信息 条 目 ”"， 指 所 有 从 缺陷 报告 中 发 现 提 
取 的 信息 。 信 息 一 共 分 为 四 类 : 事先 定义 的 栏目 【比如 产品 与 部 件 信 息 )、 补 丁 、 截 图 和 栈 跟 中 
信息 。 第 二 列 “ 主 报告 ” 指 所 有 主 报告 中 各 类 信 . SHEER 比如 ， 每 一 个 主 报告 中 只 舍 有 一 个 
操作 系统 信息 ， 在 “ 主 报 告 ”一 栏 用 1.000 表 示 。 这 与 我 们 很 多 的 项 目 经 验 一 致 ， 当 一 个 重复 缺 
陷 被 发 现 之 后 ， 它 就 被 轻易 地 关 挥 了， 相关 信息 也 被 删除 了 。 

第 三 栏 “ 扩 展 报告 ” 列 出 了 在 扩展 缺陷 报告 中 各 类 信息 的 平均 数 。 当 合并 重复 缺陷 报告 后 ， 
扩展 缺陷 报告 中 操作 条 完 信 息 的 平均 数 为 1.631。 这 里 合并 了 主 报告 与 重复 报告 ， 所 有 的 信息 都 
被 保留 。 第 四 栏 “差异 ” 指 扩展 报告 相对 于 主 报告 的 信息 增长 ， 契 相 对 于 单个 主 报告 ， 重 复 缺 陷 
报告 增加 信息 的 数量 。 例如 ， 只 要 不 删除 重复 报告 中 的 信息 ， 对 于 操作 系统 来 说 ， 重 复 报告 就 会 

















增加 平均 0.631 的 信息 
表 24- 2 的 数据 也 表明 天 部 分 重复 缺陷 报告 的 提交 者 不 是 提交 原始 报告 的 人 , 这 就 解释 了 不 同 
报告 者 数量 的 增长 。 


对 于 单个 主 报告 ， 我 们 发 现 重复 缺陷 报告 平均 增加 了 0.113 的 补丁 ，0.062 的 补丁 文件 。6% 的 
增长 相对 来 说 比较 小 ， 也 表明 了 大 部 分 补丁 是 针对 主 报告 的 ， 不 过 ， 重 复 缺 陷 增 加 了 0.145 个 截 
图 ,使 得 截图 的 数量 翻番 。 同 时 , 重复 缺陷 也 提供 了 额外 的 信息 ， 比 如 有 版本、 优先 级 与 部 件 信 息 。 

对 于 栈 跟踪 信息 ,我 们 比较 了 触发 它们 的 异常 情况 以 及 前 五 个 栈 框 架 (stack frame), Eclipse 
项 目 中 ， 重 复 缺 陷 报告 平均 增加 了 0.918 个 栈 跟 踊 信 息 (增幅 182%)。 其 中 ,平均 0.118 个 (61%) 
古 发 生 于 其 他 异 第 中 ， 以 及 0.281 个 (115.2%) 栈 跟踪 信息 包含 了 没有 被 报告 过 的 代码 位 置 (在 
前 五 个 栈 框架 中 )。 

这 些 发 现 表 明 重 复 缺 陷 捉 供 了 额外 的 信息 , 指 问 缺 陷 的 起 源 , 帮助 开发 人 员 修 复 它们 。 比如， 
面 对 程 序 崩 涡 时 ,更 多 的 栈 跟 踩 信 息 展 现 了 更 加 灵活 积极 的 方法 ， 帮 助人 们 找到 嫌疑 点 。 所 以 这 
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些 发 现 也 让 我 们 重新 思考 缺陷 跟 蹊 系统 中 重复 缺陷 的 存在 价值 。 


表 24-2 ”Eclipse 中 ， 相 对 一 个 主 报 告 ， 重 复 缺 陷 报 告 增 加 的 信息 

















ea 每 个 主 报告 的 平均 数量 
主 报告 扩展 报告 EF 

事先 定义 的 栏目 
产品 1.000 1.127 +0.127 (12.7%) 
组 件 1.000 1.267 +0.287 (28.7%) 
操作 系统 信息 1.000 1.631 +0.631 (63.1%) 
报告 的 平台 1.000 1.241 +0.241 (24.1%) 
版 本 信息 0.927 1.413 +0.486 (52.4%) 
报告 者 1.000 2.412 +1.412 (41.2%) 
优先 级 1.000 1.291 +0.291 (29.1%) 
目标 里 程 碑 0.654 0.794 +0.140 (21.4%) 
补丁 
总 数 1.828 1.942 +0.113 (6.2%) 
单独 补丁 文件 数量 1.061 1.124 +0.062 (5.9%) 
截图 
总 数 0.139 0.285 +0.145 (105.0%) 
栈 跟踪 
总 数 0.504 1.422 +0.918 (182.1%) 
独特 异常 0.195 0.314 +0.118 (61.0%) 
在 最 上 层 框 架 中 的 独特 异常 0.223 0.431 +0.207 (93.3%) 
在 最 上 两 层 框架 中 的 独特 异常 0.229 0.458 +0.229 (100.0%) 
在 最 上 三 层 框 架 中 的 独特 异常 0.234 0.483 +0.248 (106.4%) 
在 最 上 四 层 框 架 中 的 独特 异常 0.239 0.504 +0.265 (110.9%) 
在 最 上 五 层 框架 中 的 独特 异常 0.244 0.525 +0.281 (115.2%) 





a 所 有 信息 条 目的 增长 在 P< 0.001 处 都 很 明显 。 


24.7 ”并非 所 有 的 缺陷 都 被 修复 了 


大 部 分 项 目 有 许多 缺陷 因为 资源 或 者 时 间 限 制 而 没有 人 被 修复 。 为 了 体现 缺陷 报告 质量 对 于 所 
高 缺陷 修复 可 能 性 的 作用 , 我 们 从 Apache、Eclipse 和 Mozilla 项 目 中 采样 了 15 万 个 缺陷 (每 个 项 目 
5 万 个 ) 。 这 些 缺 陷 的 结 末 分 别 为 被 修复 、 重 复 缺 陷 、 转 出 、 不 子 修 复 和 未 重 现 。 我 们 将 缺陷 报告 
分 为 两 组 , 成 功 的 与 失败 的 , 然后 使 用 统计 测试 比如 卡 方 测定 (Chi Square Test) 与 Kruskal-Wallis 
测试 来 检查 缺陷 报告 成 功 与 否 与 所 提供 信息 《代码 范例 , 栈 跟踪 信息 , 补丁 ,截图 ) 之 间 的 联系 。 
我 们 通过 如 下 指标 来 比较 。 
e 0000D 
我 们 比较 了 “被 修复 ”的 缺陷 与 其 他 状态 的 缺陷 ， 比 如 “不 子 修复 M REI” Hik 
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Pa. RHEE A kEi, AA PEER TR A AY TE, HE 
没有 。 
esUUUUUUDO 

我 们 比较 了 生命 周期 较 长 与 生命 周期 较 短 的 缺陷 。 对 于 用 户 与 开发 人 员 来 说 , 较 短 的 生 
命 周 期 是 较为 理想 的 。 


我 们 也 评估 了 可 读 性 对 于 缺陷 报告 的 影响 。 我 们 使 用 Style 工 具 来 度量 缺陷 报告 的 可 读 性 , E 
“分 析 了 文档 撰写 风格 的 表面 特征 ”"。 度 量 文档 可 读 性 就 是 计算 每 个 字 的 音节 数 以 及 句子 的 长 
度 。 亚 马 进 公 司 使 用 文档 可 读 性 来 评估 书籍 的 陪读 难度 已 告知 读者 ,美国 海军 也 用 它 来 保证 技术 
文档 的 可 读 性 。 在 我 们 的 实验 中 ， 我 们 使 用 了 下 列 七 种 可 读 性 指标 : Kincaid, ARI (Automated 
Readability Index， 自 动易 读 性 指数 )、Coleman-Liau、Flesh、Fog、Lix 与 SMOG 等 级 。 

实验 结果 如 下 : 

O 缺陷 报告 中 含有 栈 跟 踪 信 息 ， 被 修复 速度 更 快 (Apache, Eclipse 和 Mozilla) , 

O 缺陷 报告 更 易于 陪读， 被 修复 速度 更 快 (Apache、 Eclipse 和 Mozilla) , 

O 缺陷 报告 中 含有 代码 范例 ， 被 修复 的 可 能 性 更 高 (Mozilla) 。 

并 且 ， 独 立 于 我 们 的 实验 ，Hooimeijer 与 Weimer 发 现 Firefox 中 带 有 附件 的 缺陷 报告 会 稍 后 才 
被 处 理 ， 而 带 有 很 多 注释 的 缺陷 报告 则 会 被 更 快 地 修复 。 他 们 也 确认 了 我 们 的 发 现 即 容易 阅读 
的 缺陷 报告 会 更 快 被 修复 。Panjer 观 察 到 Eclipse 项 目 中 广 释 的 数量 ， 活 跃 度 和 严重 程度 对 缺陷 的 
生命 周期 最 有 影响 力 " 。Schroter 等 人 也 佐证 了 我 们 的 发 现 ， 即 有 栈 跟 踪 信 息 的 缺陷 会 更 快 被 修 
复 ， 并 且 重 申 了 在 缺陷 报告 中 加 入 栈 跟 踪 信 息 的 重要 性 “ 。Guo 等 人 在 微软 中 做 的 一 项 关于 
Windows Vista 与 Windows 7 的 实验 “中 发 现 重 赋值 的 数量 ， 组 织 和 地 理 分 布 ， 缺 陷 报 告 者 声誉 都 
会 形 啊 缺陷 被 修复 的 可 能 性 。 

本 证 中 的 发 现 表 明 , 一 份 书写 民 好 的 缺陷 报告 帮助 人 们 更 好 地 理解 缺陷 ， 从 而 也 能 提高 短 时 
间 内 修复 缺陷 的 可 能 性 。 








24.8 结论 


缺陷 报告 对 于 维护 软件 产品 质量 至 关 重 要 。 开 发 人 员 利 用 缺陷 报告 中 的 信息 找 出 缺陷 发 生 的 
原因 ， 然 后 解决 回 题 。 但 为 了 实现 这 一 目的 ， 要 保证 缺陷 报告 中 的 内 容 是 可 靠 的 ， 也 是 完 整 的 。 

但 是 一 份 高 质量 的 缺陷 报告 是 什么 样 的 呢 ? 我 们 从 三 个 大 型 开源 项 目 中 对 相关 的 开发 者 和 
报告 者 展开 了 调查 , 在 本 革 中 给 出 了 分 析 结 采 , 并 从 被 访 者 的 角度 分 析 了 缺陷 报告 中 哪些 内 容 古 
最 重要 的 。 开 发 人 员 的 问卷 调查 结 末 显示 他 们 认为 栈 跟 踊 信息， 重 现 缺陷 步 又 ,以 及 期 望 行为 与 
观察 到 行为 对 于 修复 缺陷 是 十 分 重要 的 。 有 趣 的 古 ， KARA ERG ZR, Are 
他 们 没有 经 第 提供 这 类 信息 。 这 里 开发 人 员 所 希望 得 到 的 信息 与 报告 者 实际 提供 的 信息 之 间 存 在 
M. 

ATLA Ber ay CNR et Ek PA Ree R ARR E EAE A RRA LA (自动 
IRPEF AT eee E) TT AE R ent ae A EE RAKERA 
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明 重 复 的 缺陷 报告 包含 了 一 些 其 他 有 用 信息 , 所 以 也 许可 以 把 新 的 信息 自动 合并 入 原始 的 缺陷 报 
告 中 。 同 时 我 们 还 可 以 加 入 激励 措施 ， 比 如 列 出 提供 某 些 信息 的 优点 (有 栈 跟踪 信息 的 缺陷 报告 
修复 得 更 快 )， 辟 励 缺陷 提交 者 为 改进 缺陷 报告 多 出 一 些 力 。 

总 体 来 说 ， 缺 陷 报 告 质量 越 高 ， 修 复 速度 束 越 快 。 同 时 视 报 告 者 与 开发 人 员 都 工作 顺利 ! 


24.9 ”致谢 
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Dewayne Perry 


软件 开发 管理 的 终极 目标 是 “更 便宜 ， 更 快 ， 更 好 "。 可 惜 的 是 ， 很 多 时 候 目 标 虽然 定 得 很 
好 ， 但 是 实现 目标 的 计划 却 差 强人 总 。 使 软件 “更 便宜 ,更 快 ”固然 重要 ， 但 是 对 于 很 多 软件 系 
统 来 说 ， 称 定性 和 安全 性 更 为 重要 。 在 这 种 情况 下 ， 做 出 “更 好 ”的 软件 才 征 最 要 标 的 任务 。 

使 软件 更 好 的 办 法 有 很 多 。 无 论 是 清楚 地 认识 客户 的 需求 , 还 是 最 大 限度 地 减少 软件 的 故障 
等 措施 ， 都 可 以 使 软件 更 好 。 本 和 草 主 要 关注 的 是 减少 软件 故 隐 这 一 点 。 只 有 找到 了 问题 的 所 在 ， 
我 们 才能 对 症 下 络 地 改进 我 们 的 产品 或 者 流程 。 而 监控 故障 相对 来 说 是 一 种 比较 简单 的 方法 ， 
为 它 要 么 本 来 就 存在 于 项 目的 流程 之 中 , 要么 就 只 存在 于 项 目的 回顾 会 议 (党 被 称 为 “亡羊补牢 
会 议 ) 里 。 

复杂 性 是 软件 系统 最 重要 和 最 基本 的 特征 ， 而 控制 这 种 复兴 性 则 古 减 少 软件 故障 的 基本 理 
l= 控制 复杂 性 的 方法 有 很 多 ,最 有 用 的 一 种 是 把 软件 组 件 的 接口 和 实现 区 分 开 来 。 基 于 这 个 
重要 方法 ， 本 草 将 论述 接口 类 故障 和 实现 类 故障 的 区 别 。 


25.1 研究 软件 的 缺陷 


一 个 令 人 遗憾 的 现实 是 ， 关 于 软件 故障 的 研究 成 末 发 表 得 很 少 ， 使 得 人 们 难以 对 软件 故障 
的 检测 、 改 善 和 预防 做 更 多 系统 的 研究 。 不 过 从 另 一 方面 来 说 ， 项 目 组 不 愿 发 布 这 些 研 究 成 采 
也 很 正 销 ， 因 为 发 布 这 些 敏 感 的 研究 和 数据 ， 不 仅 可 能 引起 组 织 内 部 的 了 矛盾， 也 会 带 来 外 部 的 
竞争 压力 。 

虽然 研究 软件 故障 的 资料 很 少 ， 我 们 仍然 有 一 系列 里 程 碑 式 的 关于 软件 故障 的 研究 ， 可 以 
作为 改善 产品 和 流程 的 基础 。Endres”，、Schneidewind 及 Hoftman DA X Glass "HPR Rikk Y Mi 
的 论文 。 不 过 ， 他 们 的 研究 有 着 一 个 共同 的 缺憾 ， 就 古 没 有 把 接口 故障 作为 一 个 专门 的 分 类 进 
行 研 究 。 

Thayer、 Lipow 和 Nelson “以及 Bowent 在 他 们 的 著作 中 非常 详尽 地 阐述 了 软件 故障 的 分 类 ， 
但 是 关于 接口 故障 的 部 分 却 相 对 局 限 。Basili 和 Perricone 二 曾 发 表 过 极为 全 面 的 软件 故障 研究 报 
告 。 报 告 集中 讨论 了 中 等 大 小 的 软件 系统 在 初始 开发 阶段 遇 到 的 问题 ,他们 记录 下 了 故障 的 数据 、 
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受 影 响 的 组 件数 目 、 故 障 的 类 型 以 及 解决 故障 所 需 的 工作 量 。 其 中 ， 接 口 故障 占据 了 39”%， 征 数 
量 最 多 的 故障 类 别 。 

不 过 我 们 发 现 ， 这 些 研 究 中 ,没有 一 个 提 到 关于 超大 型 软件 系统 中 可 能 遇 到 的 同 题 也 没有 
提 到 在 软件 的 后 续 开发 阶段 中 遇 到 的 问题 Perry 和 Evangelist ”是 首先 研究 大 型 实时 系统 后 续 
开发 阶段 故障 的 人 。 他 们 的 研究 成 来 中 有 一 项 极为 重要 ， 那 就 是 接口 故障 是 目前 为 止 最 第 见 的 政 
障 ， 占 到 所 有 故障 的 68%。 这 就 留 下 了 一 个 问题 ,这些 接 口 故障 古人 耕 容易 检测 和 修复 ? 

要 知道 , 软件 的 急 始 开发 和 后 续 开 发 是 截然 不 同 的 。 对 于 前 者 , 设计 和 实现 工作 的 限制 很 少 ，; 
而 对 于 后 者 ， 由 于 开发 人 员 和 前 前 必须 基于 已 经 存在 的 系统 做 出 修改 ， 所 以 不 但 限制 很 多 ， 而 且 要 
理 清楚 修改 相关 的 连 市 关系 也 变 得 越发 困难 。 软 件 的 后 续 开 发 阶段 比 初始 开发 阶段 要 长 得 多 ,所 
以 关于 这 个 阶段 出 现 的 软件 故障 的 研究 也 重要 得 多 。 

在 这 一 半 里 ,我 们 将 详细 研究 一 个 超 稳定 、 超 大 型 的 实时 软件 系统 的 一 个 发 行 版 本 。 之 所 以 
没有 把 多 个 来 目 各 行 各 业 的 中 型 系统 拿 来 做 横 癌 研究 ， 征 因为 如 采 只 研究 一 个 大 型 的 系统 的 话 ， 
我 们 可 以 对 鳌 个 系统 认识 得 更 深 ,也 对 其 问题 认识 得 更 深 。 当 然 缺 点 也 显而易见 ， 那 束 是 研究 成 
朱 相 对 来 说 没 那 么 容易 适用 于 更 多 的 情况 。 这 种 利 葡 的 权衡 在 实证 研究 中 很 汕 见 。 

接 下 来 我 们 将 看 到 的 ， 征 这 种 深入 的 认识 市 给 我 们 的 一 些 有 用 的 见解 。 比 如 ， 我 们 凋 毅 认为 
“我 们 只 要 能 发 现 bug， 就 可 以 很 容易 地 修复 它 。 但 实际 上 ， 我 们 的 数据 和 这 样 的 “常识 ” 却 正 
好 相反 。 此 外 ， 对 于 之 前 留 下 的 那个 问题 ， 得 到 的 数据 文 持 了 原来 的 猜测 ， 即 : 接口 故 取 要 比 实 
现 故障 更 难以 修复 。 


25.2 本 次 研究 的 环境 和 背 太 


本 章 所 讨论 的 这 个 系统 是 一 个 非常 大 的 (100 万 行 代 码 或 更 多 ) 分 布 式 实时 系统 ， 主 要 用 C 
语言 写成 (也 包含 部 分 针对 不 同 领 域 的 程序 语言 )， 系 统 的 开发 基于 Unix 环 境 ， 多 个 工作 站 分 布 
于 不 同 的 地 所 同时 进行 开发 。 

项 目 组 织 结构 是 典型 的 大 型 项 目 结构 ， 由 多 个 不 同 组 织 提供 人 员 , 每 个 组 织 负责 不 同 部 分 的 
开发 。 各 个 组 织 分 别人 负 贡 需求 分 析 、 架 构 、 设 计 、 编 写 代 码 、 机 能 测试 、 系 统 及 稳定 性 测试 以 及 
a WK. 

开发 流程 也 是 典型 的 大 型 项 目 开发 流程 。 系 统 工程 师 先 准备 非 正 式 的 结构 化 文档 ， 定 义 修 
改 系 统 的 需求 。 然 后 设计 师 们 根据 这 些 需 求 准 备 非 正式 的 设计 文档 ， 再 根据 该 设计 的 大 小 选择 
3 一 15 名 人 员 进 行 正式 的 评审 。 然 后 这 些 设 计 将 被 分 为 小 块 进行 底层 的 设计 和 代码 编写 。 在 这 个 
阶段 ， 将 有 3 ~ 5 个 评审 员 对 产品 进行 评审 ， 并 有 人 员 对 其 进行 感 层 单元 测试 。 当 组 件 通 过 这 一 
系列 程序 ， 可 以 投入 使 用 时 ， 开 发 人 员 将 不 断 进行 整合 和 系统 测试 ， 直 到 系统 整合 完成 。 

我 们 讨论 的 这 个 版 本 是 一 个 “后 续 开 发 版 本 "。 我 们 可 以 把 这 样 的 一 个 版 本 看 做 是 这 个 系统 
发 展 过 程 中 的 一 个 市 上 。 由 于 规模 很 大 ， 这 个 系统 的 发 展 包 含 着 多 个 并 行 的 版 本 。 也 就 古 说 , R 
然 版 本 发 表 的 日 期 征 按 照 顺 序 来 的 ， 但 每 个 组 件 和 都 征 同 时 在 开发 ， 都 处 于 不 同 阶 段 ， 而 且 都 有 着 
目 己 的 版 本 。 这 种 并 行 性 帝 来 的 是 版 本 之 间 的 依赖 性 ， 以 及 由 此 引发 的 更 多 的 问题 。 除 了 版 本 的 
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并 行 性 以 外 ， 每 一 个 新 版 本 中 增加 的 代码 量 〈 大 约 每 个 版 本 15% 一 20% 的 新 代码 ) 和 变更 (bug 
修改 、 功 能 改进 、 新 功能 等 ) 都 大 同 小 异 。 正 是 基于 这 两 点 ， 我 们 认为 研究 中 的 这 个 版 本 可 以 作 
为 整个 软件 生命 周期 中 的 一 个 代表 性 的 市 点 。 

测试 环节 中 发 现 的 故障 会 被 报告 并 由 一 个 修改 请 求 (Modification Request, MR) 跟踪 系统 
(例如 CMS 一) 来 监控 。 只 有 通过 这 个 系统 才能 修改 源 代 码 。 这 就 保证 了 所 有 的 修改 (无 论 是 
故障 修复 ,添加 功能 或 者 是 改善 功能 ) 都 会 被 自动 记录 下 来 。 不 过 需要 留意 的 是 ， 故 障 跟踪 只 会 
在 测试 和 发 布 环 进行 ,并 不 会 在 构架 、 设 计 和 代码 编写 部 分 进行 。 在 这 些 环 市 出 现 的 问题 不 会 
PMR ASICs, Mire HIPAA A THE 

这 个 研究 的 目标 是 通过 专注 分 析 一 个 特定 系统 的 茶 一 个 版 本 , RA TRARRE. FR 
们 使 用 的 方法 是 问卷 调查 。 我 们 准备 了 一 份 问 卷 ， 发 给 那些 解决 故障 的 开发 人 员 。 我 们 首先 调查 
所 有 类 型 的 故障 , 再 深入 分 析 这 些 故 陪 中 发 生 率 最 高 的 类 型 。 虽然 以 前 有 过 用 随机 问卷 调查 的 小 
型 研究 ， 但 这 种 类 型 的 回 卷 调查 疯 属 首次 。 我 们 先 用 MR 系统 的 故障 数据 库 来 确定 我 们 需要 进行 
调查 的 故障 和 解决 这 些 故障 的 开发 人 员 ， 然 后 再 将 这 些 问卷 发 给 他 们 。 

由 于 种 种 原因 〈 包 括 时 间 安 排 方面 的 压力 ) ， 项 目 管理 层 给 我 们 的 研究 做 了 很 多 的 限制 : 第 
一 ， 我 们 绝对 不 能 妨碍 到 项 目的 正常 进行 ， 第 二 ， 人 赋 究 对 象 必 须 征 目 愿 参与 ;第 三 ， 人 研究 必须 是 
完全 匿名 的 。 我 们 的 研究 受到 这 些 限 制 的 制约 将 不 可 避免 地 有 一 些 缺 陷 。 本 章 后 面部 分 将 会 讨论 
这 些 限 制 对 此 次 研究 的 有 效 性 的 彩 啊 。 

这 就 古本 次 研究 的 背景 。 所 有 问卷 调查 、 分 析 以 及 结论 邦 基 于 此 背景 。 


25.3 ”第 一 阶段 : 总体 调查 


总 体 调查 有 三 个 具体 的 目的 : 
O 确定 我 们 找到 了 何 种 问题 《我 们 将 在 此 讨论 ) ， 以 及 ， 在 开发 这 个 版 本 的 过 程 中 ， 遇 到 了 
何 种 只 跟 这 个 应 用 程序 相关 的 问题 (我 们 将 不 会 讨论 ， 因 为 没有 普遍 性 )，; 

O 确定 问题 是 如 何 被 发 现 的 【 即 在 哪个 测试 的 环 市 被 发 现 )， 

O 确定 问题 是 何 时 被 发 现 的 。 

在 经 验 性 回 卷 调查 中 我 们 党 第 过 到 的 一 个 问题 ， 就 是 如 何 保证 这 些 问 卷 都 症 用 被 调查 者 的 
“语言 ”来 写 的 。 这 里 的 “语言 ”不 止 包括 公司 内 部 或 者 项 目 组 内 部 的 专用 术语 ， 也 包括 专用 的 
流程 。 在 做 调查 的 时 候 ， 我们 希望 接受 问卷 调查 的 开发 人 员 能 够 完全 地 理解 所 同 到 的 问题 。 如 末 
被 调 奋 者 看 不 明 昌 问题 ， 将 会 使 研究 的 准确 性 受到 质疑 。 为 了 解决 这 个 问题 ,我们 请 了 开发 人 员 
帮助 我 们 设计 这 个 问卷 ， 我 们 也 使 用 了 项 目 组 的 术语 和 流程 以 便于 被 调查 者 理解 问卷 上 的 同 题 。 





























25.3.1 调查 问卷 


第 一 阶段 的 问卷 包含 了 两 个 主要 的 部 分 : 一 是 确定 故障 的 分 类 , 二 是 确定 发 现 故 障 的 具体 测 
试 阶 段 。 确 定 故 障 的 分 类 有 两 个 重点 : 一 征 引 入 故障 的 阶段 ， 二 征 故 隐 的 类 型 。 由 于 在 总 体 调 奉 
阶段 所 调查 到 的 故障 类 型 第 第 只 跟 这 个 程序 或 者 这 个 项 目 使 用 的 方法 相关 , 所 以 我 们 更 侧重 于 故 
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障 起 源 方面 的 特质 。 下 面 我 们 列 出 故障 的 分 类 。 


= UU 

前 一 个 版 本 未 解决 而 遗留 下 来 的 问题 。 
Ui 

在 需求 分 析 环 市 出 现 的 问题 。 
iL 

在 构架 和 设计 环 东 出 现 的 问题 。 
eHUUU 

TEAS Ft 5S Fi HE BLAS [8] el 
eHUUU 

在 搭建 或 者 准备 测试 环境 时 出 现 的 问题 《例如 系统 设置 错误 ， 静 态 数 据 等 )。 
s LL 

测试 中 发 生 的 问题 《如 运行 故障 等 )。 
© il. 

已 经 报告 过 的 问题 。 
e 

由 于 用 户 误 解 界 面 或 者 功能 所 产生 的 问题 。 
e UU 


其 他 无 法 分 类 的 问题 ， 例 如 硬件 问题 等 。 


问卷 的 另 一 个 组 成 部 分 是 关于 发 现 故 障 的 测试 环 疝 。 负 试 分 为 以 下 几 类 : 
e [] [| O U Uf Capability Test|] CTU 
分 离 系 统 的 不 同 部 分 并 确认 每 个 部 分 性 能 的 测试 。 
e [] [| O UU System Test|] STU 
在 实验 室 坏 境 中 确定 系统 整体 运行 正常 的 测试 。 
e [| [| UU 0 U UU System Stability Test|] SSL 
FESR IRE, RARE Sitar TAM 
e a [| [| U Alpha Test|] ATU 
由 友善 的 用 户 (通常 为 组 织 内 部 人 士 ) 对 即将 正式 发 行 的 版 本 进行 使 用 测试 。 
e [| 0 U0 UU D Released[] RE[] 
即 正常 使 用 ; 但 需要 注意 的 是 ， 在 我 们 的 研究 中 这 一 项 指 的 不 是 当前 的 版 本 ， 而 是 上 一 
个 版 本 的 使 用 ， 我 们 希望 这 项 数据 能 够 让 我 们 预见 到 当前 版 本 的 问题 。 


除 此 之 外 ， 我 们 还 从 MR 数据 库 中 提取 了 这 些 故 障 从 发 现 到 解决 所 花费 时 间 的 数据 。 

在 理想 状态 下 , 这 些 神 试 都 是 按 顺 序 进行 的 。 但 实际 上 当 在 开发 规模 较 大 和 复杂 程度 较 高 的 
系统 时 ， 这 些 测 试 环 广 可 能 有 所 重合 。 我 们 分 析 一 下 这 种 重合 的 成 因 。 首 先 ， 系统 的 多 个 部 件 同 
时 在 被 修改 。 这 就 意味 着 在 任意 一 个 时 间 点 上 ， 这 些 部 件 都 分 别处 于 不 同 的 开发 阶段 。 其 次 ， 软 
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件 开 发 的 反复 性 使 得 我 们 在 开发 某 些 部 件 的 时 候 第 第 退回 到 之 前 的 阶段 。 第 三 ， 即使 知道 组 件 不 
完整 ,我们 仍然 需要 尽早 进行 测试 以 发 现 可 能 存在 的 问题 。 这 样 看 来 ,测试 计 循 一 种 从 下 至 上 的 
层级 模式 : 先是 测试 各 个 部 件 ， 再 测试 多 个 部 件 组 成 的 子 系 统 ， 最 后 将 测试 好 的 子 系统 整合 成 为 
完整 的 系统 。 某 个 部 件 该 在 什么 时 候 进 行 下 一 阶段 的 测试 通 第 由 开发 人 员 目 己 判 断 , 而 多 数 情 况 
下 这 取决 于 功能 的 完成 度 和 已 经 进行 了 的 测试 数量 。 我 们 也 可 以 说 ， 系 统 规模 和 复杂 程度 越 大 ， 
系统 负载 和 压力 就 越 大 ， 测 试 的 阶段 也 就 越 后 期 。 
25.3.2 ”数据 的 总 结 

表 25-1 总 结 了 这 些 故 障 的 类 别 情况 。 发 生 在 初期 的 故障 ( 即 需 求 、 设 计 或 者 代码 编写 环 市 ) 
最 多 ， 约 占 总 数 的 33.7%。 由 于 在 通 稼 情况 下 设计 类 故障 和 代码 编写 类 的 故障 难以 分 别 ， 我 们 决 
定 把 它们 分 作 一 类 : 即 设计 /代码 编写 类 故障 ， 占 总 数 的 28.8%。 不 过 ， 在 这 个 项 目 所 使 用 的 流程 
中 ， 需 求 类 和 设计 /代码 编写 类 的 故障 之 加 的 区 别 是 很 明显 的 : 系统 工程 师 写 需求 规格 文档 ， 开 
发 人 员 做 设计 并 编写 代码 。 

表 25-1 故障 总 结 


类 型 比例 
ee 4.0% 
需求 4.9% 
设计 10.6% 
代码 编写 18.2% 
测试 环境 19.1% 
测试 5.7% 
重复 13.9% 
韭 问 题 15.9% 
其 他 7.8% 


紧 接 着 ,下 一 个 出 现 较 多 的 故障 类 型 是 和 测试 相关 的 故障 〈 包 括 测 试 环境 和 各 测试 阶段 中 找 
到 的 故障 )， 占 总 数 的 24.8%。 要 对 这 样 庞 大 和 精密 的 实时 系统 进行 测试 ， 需 要 在 试验 室 中 模拟 
出 接近 现实 世界 的 复杂 运行 环境 ， 出 现 这 么 多 问题 也 不 奇怪 : 首先 ， 测试 环境 本 里 就 是 一 个 庞 
大 而 精密 的 系统 ， 它 本 映 就 需要 做 很 多 测试 其次， 随 着 实时 系统 发 展 得 越 来 越 大 越 来 越 复 厅 ， 
测试 环境 也 必须 跟着 发 展 起 来 。 不 过 总 的 来 说 ， 这 走 一 个 普 遇 存在 的 问题 ， 它 需要 更 深入 的 研 
究 来 解决 。 

重复 和 非 同 题 类 故障 是 另 一 个 大 头 ， 占 了 总 量 的 29.8%。 传 统 观 念 中 稍 将 这 两 个 看 作 
古 非 必要 开销 (overhead) 的 一 部 分 。 确 实 ， 出 现 大 量 重复 类 故障 是 由 大 型 项 目 中 各 种 工作 的 并 
发 性 所 5 起 的 ， 所 以 难以 避免 。 然 而 ,大 部 分 非 问 题 类 故障 却 是 因为 不 严谨 或 者 过 期 的 文档 所 种 
来 的 误解 造成 的 。 不 过 可 以 上 有 定 的 是 ,为 减少 这 两 类 问题 而 采取 的 各 种 措施 也 会 对 其 他 问题 的 解 
决 起 积极 作用 。 无 论 如 何 ， 减 少 不 必 要 的 行政 开销 ， 都 将 提高 项 目的 成 本 效益 。 
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遗留 ”类 故障 的 数量 代表 着 在 这 样 一 个 大 型 的 实时 系统 中 发 现 问 题 的 困难 程度 。 这 些 问 题 
可 能 在 上 一 个 版 本 中 根本 没 能 被 察 完 ， 直 到 后 来 系统 的 功能 发 生变 化 之 后 才 凸 显 出 来 。 

图 25-1 展 示 了 不 同 测 试 阶段 中 的 需求 、 设 计 及 代码 编写 类 故障 。 我 们 主要 关注 了 软件 开发 早 
期 的 故障 ， 因 为 这 个 阶段 的 故 隐 了 最多， 更 多 的 关注 可 以 让 我 们 得 到 更 多 的 数据 。 





CT ST SS AT RE 
需求 故障 一 CT: 性 能 测试 阶段 
1 ST: 系统 测试 阶段 

代码 编写 玖 障 .ww SS: 系统 稳定 性 测试 阶段 


AT: 内 部 测试 阶段 
RE; 发 行 后 实际 使 用 阶段 


图 25-1 ”故障 分 类 图 示 ( 按 阶 段 ) 


请 注意 图 25-1 和 图 25-2 中 的 故障 百分比 征 相 对 于 所 有 故障 的 ， 而 不 是 相对 于 图 中 所 显示 的 故 
区。 此 外 ， 在 图 25-1 中 各 个 测试 环 贡 至 顺序 排列 ， 但 实际 上 ， 在 几乎 所 有 软件 系统 的 开发 过 程 
中 ， 各 个 环 太 相互 间 存 在 着 很 多 并 行 和 重合 的 情况 。 虽 然 软件 开发 的 流程 由 一 系列 (通常 是 送 
代 ) 的 环 市 组 成 ， 但 由 于 成 百 上 千 的 工程 师 同时 在 开发 成 百 上 千 个 功能 ， 实 际 的 开发 流程 和 我 
们 所 熟知 的 渡 布 模式 完全 不 同 。 这 也 正 古 为 什么 我 们 用 了 田 一 幅 图 25-2 来 按时 间 顺 序 展示 和 图 
25-1 同 样 的 数据 。 
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需求 故障 
UL Ghesecsuetece hae 
代码 编写 故障 .ee 


图 25-2 ”故障 分 类 图 示 (按时 间 ) 


有 两 个 重点 值 得 留意 。 首 先 ， 系 统 测 试 (ST) 是 各 类 故障 高 发 的 环 市 ， 性 能 测试 (CT) 紧 
随 其 后 。 这 并 不 奇怪 , 在 这 两 个 环 市 中 我 们 通常 做 好 了 迎接 问题 的 准备 , 并 会 费 尽 心思 找 出 回 题 。 
在 系统 测试 的 环 太 中 ,所 有 组 件 党 一 次 被 整合 成 系统 ， 所 以 极 可 能 出 现 很 多 部 件 之 间 不 吻合 或 者 
配合 不 当 的 问题 。 也 就 是 说 ， 虽然 所 有 测试 的 目的 都 是 为 了 找到 错误 , 但 古 在 系统 测试 中 我 们 会 
TD, 试图 找到 更 多 的 错误 。 而 性 能 测试 和 单元 测试 寻找 的 故障 是 类 似 的 一 一 部 是 为 了 
找 出 内 部 和 初始 交互 中 的 故障 。 这 种 特性 限制 了 在 性 能 测试 中 能 找到 的 故障 类 型 。 

我 们 观 紧 到 的 第 二 点 , 征 在 每 一 个 测试 环 太 中 都 发 现 了 所 有 类 型 的 故障 。 例 如 代码 编写 类 的 
故障 在 每 个 测试 环 市 中 都 有 发 现 。 这 并 不 奇怪 ,一 个 显 而 多 见 的 解释 是 早期 的 测试 环 贡 中 发 现 的 
问题 需要 后 来 不 断 地 修改 系统 才能 解决 。 此 外 ,虽然 从 头 到 尾 都 能 见 到 设计 和 需求 类 的 故 隐 让 人 
感到 很 担心 ， 但 古 我 们 认为 这 是 由 于 需求 /设计 文档 不 够 准确 和 完整 而 造成 的 。 而 且 ， 我 们 认为 
这 是 一 个 普 瑶 存在 于 流程 层面 的 问题 ， 而 不 是 仅 存 于 这 个 项 目 中 的 问题 。 

图 25-2 中 的 时 间 扣 是 均匀 分 布 的 。 从 图 的 形状 来 看 ， 我 们 不 难看 出 系统 测试 和 世 区 间 之 间 的 

















342 第 25 章 软件 的 缺陷 都 从 哪儿 来 


重 又 。 很 不 幸 的 是 ， 我 们 只 有 时 间 数 据 ( 即 故障 的 发 现 和 解决 时 间 )， 如 果 有 工作 量 数据 "”( 即 
从 故障 的 发 现 到 解决 中 实际 花费 的 时 间 ) 作为 参考 对 比 将 使 我 们 的 研究 更 有 意义 。 

此 外 ， 我 们 从 图 25-2 中 还 能 看 出 ， 几 乎 所 有 类 型 的 故障 ， 包 括 需求 、 设 计 和 代码 编写 类 故障 
的 数量 都 在 人 4 这 个 点 达到 了 峰值 ， 并 且 几乎 都 保持 到 了 45。 除 了 代码 编写 类 故障 ， 它 从 地 开 始 慢 


慢 减 少 。 
25.3.3 ”第 一 阶段 的 研究 总 结 


下 面 这 些 古 我 们 从 研究 这 个 不 断 成 长 的 大 型 实时 系统 中 观察 到 的 一 些 结案 。 

O 代码 编写 类 、 视 试 类 和 行政 上 的 非 必 要 开销 所 占 的 比例 大 臻 相同。 

O 需求 问题 虽然 数量 并 不 非常 大 ， 但 却 非常 重要 (尤其 因为 大 部 分 需求 问题 都 是 在 晚期 的 

测试 中 才 被 发 现 )。 

在 每 一 个 济 试 环 市 中 都 发 现 了 所 有 类 型 的 故障 。 

O 在 强度 最 大 的 测试 环 三 ( 即 系 统 测 试 环 广 ) 发 现 的 故障 最 多 。 

O 多 数 故 障 部 十 在 测试 周期 的 后 期 才 被 发 现 。 

这 些 总 结 有 一 定局 限 性 ， 因 为 追踪 错误 MR 主要 是 一 个 测试 行为 。 如 来 我 们 可 以 观察 记录 在 
项 目 开 发 早期 出 现 的 故障 类 型 和 数量 ， 那 将 对 我 们 的 研究 非常 有 用 。 此 外 ， 如 琳 可 以 将 检测 需求 
和 设计 类 故 隐 的 方法 也 算 入 开发 流程 的 一 部 分 ， 也 会 对 研究 有 帮助 。 


25.4 第 二 阶段 : 设计 /代码 编写 类 故障 调查 


基于 总 体 调查 的 结案 ， 我 们 决定 深入 调查 设计 /代码 编写 类 故障 。 在 这 个 部 分 的 研究 中 ， 我 
们 想 要 达到 的 目的 如 下 : 

口 确定 发 生 在 设计 和 代码 编写 中 的 故障 的 类 型 ， 

O 确定 找 出 故障 、 再 现 故 障 、 解 决 故 障 的 难度 ， 

O 确定 出 现 故 障 鸭 深层 次 原因 ，; 

O 找 出 可 能 避免 故障 的 方法 ; 

O 对 比 寻找 和 解决 接口 类 故障 和 实现 类 故障 的 难度 。 

选择 这 个 类 别 的 故障 作 为 这 个 部 分 的 研究 对 象 有 两 个 原因 。 第 一 ， 要 区 别 这 两 种 故障 实在 非 
前 困难 。 第 二 , 在 项 目 早 期 发 现 这 两 种 故障 将 会 极 大 地 降低 花费 在 发 现 故 障 上 的 总 体 成 本 ， 也 融 
是 说 ， 在 系统 整合 之 前 发 现 故 障 比 在 整合 之 后 的 实验 室 测 试 阶段 再 发 现 故 障 所 需 的 成 本 要 小 得 
多 。 在 这 一 点 上 , 我 们 得 到 的 数据 和 Boehm 的 研究 数据 ”一致 (参见 Barry Behem 所 作 的 第 10 章 )。 

在 下 面 两 个 小 市 ， 我 们 将 分 析 我 们 使 用 的 调查 问卷 ， 提 出 我 们 的 统计 分 析 结 有 末 ， 以 及 我 们 关 
于 接口 和 实现 类 故 隐 的 研究 结论 。 





25.4.1 Wee 
我 们 让 参加 调查 的 人 员 指 出 找到 和 解决 故障 的 难度 , 确定 出 现 故 障 的 深 层次 的 原因 ,指出 最 
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好 的 预防 或 者 避免 这 些 问题 的 方法 ,并 告诉 我 们 他 们 对 上 自己 的 回答 有 多 大 把 握 。 需 要 注意 的 一 后 
是 ， 参 与 调查 的 人 古 在 最 后 解决 故障 的 人 。 具 体 问 题 如 下 所 示 。 
口 按照 发 现 和 重 现 的 困难 程度 为 每 个 故障 分 级 。 





(1) 容易 一 一 可 随意 重 现 。 
(D) 中 等 一 一 偶尔 《间歇 性 ) 可 以 重 现 。 





(3) 困难 一 一 需要 推测 和 尝试 才能 找 出 重 现 的 方法 。 
(4) 非常 困难 一 一 极 难 重 现 。 


口 要 解决 这 个 故障 需要 多 少时 间 来 设计 和 编写 代码 ， 以 及 用 文档 记录 和 测试 的 时 间 。( 注 意 
在 单程 序 员 的 开发 环境 中 能 很 快 解决 的 问题 ， 在 多 人 同时 作业 ， 复 杂 的 实验 室 测 试 开发 
环境 中 将 需要 更 多 时 间 来 解决 ) 

(1) 容易 一 一 1 天 内 即 可 解决 。 
(2) 中 等 一 一 1 到 5 天 内 。 
(3) 困难 一 一 6 到 30 天 内 。 
(4) 非常 困难 一 一 30 天 以 上 。 


O 对 于 每 个 故障 ， 考 虑 以 下 22 个 原因 并 从 中 选择 一 个 作为 直接 造成 故障 的 原因 〈 即 故障 的 
类 型 ) 。 
(1) 程序 语言 陷阱 一 一 如 指针 问题 ， 或 者 “=” 人 代替 了 “一 ”的 问题 。 
(2) 通信 协议 一 一 未 按照 进程 间 通 信 协 议 约定 造成 问题 。 
(3) 底层 逻辑 一 一 例如 无 限 循 环 问题 ， 指 针 初 始 化 问题 ， 等 等 。 
(4) CMS 复杂 度 一 一 例如 由 软件 变更 管理 系统 (Change Management System, CMS) 的 复 
杂 度 引起 的 问题 。 
(5) 内 部 功能 性 一 一 模块 / 子 系 统 内 部 功能 不 完整 ， 或 者 需要 添加 、 修 改 。 
(6) 外 部 功能 性 一 一 模块 / 子 系 统 外 部 功能 不 完整 ， 或 者 需要 添加 、 修 改 。 
(7) 原始 数据 类 型 误 用 一 一 设计 或 者 代码 编写 需要 依赖 的 原始 数据 类 型 未 被 “正确 使 用 ”。 
(8) 原始 数据 类 型 不 支持 一 一 设计 或 者 代码 编写 需要 依赖 的 原始 数据 类 型 尚未 开发 完全 
( 即 原始 数据 类 型 不 能 正常 使 用 )。 
(9) 变更 协调 一 一 不 知道 之 前 的 变更 或 者 依赖 同时 进行 的 变更 。 
(10) 接口 复杂 度 一 一 接口 的 结构 差 或 者 过 于 繁杂 。 
(11) 设计 /代码 复杂 度 一 一 实现 层面 的 结构 差 或 者 过 于 繁杂 。 
(12) 错误 处 理 一 一 对 于 异常 的 处 理 或 者 修复 不 正确 。 
(13) 争 用 情况 一 一 数据 的 共享 没 协调 好 。 
(14) 性 能 一 一 如 不 能 满足 程序 在 实时 性 ， 资 源 的 访问 效率 或 者 反应 时 间 上 的 规定 。 
(15) 资源 分 配 一 一 资源 的 分 配 或 者 解除 分 配 不 当 。 
(16) 动态 数据 设计 一 一 动态 数据 资源 或 者 结构 的 设计 不 当 。 
(17) 动态 数据 使 用 一 一 动态 数据 资源 或 者 结构 的 使 用 不 当 ， 例 如 初始 化 或 者 保持 约束 条 
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件 (constraints) 不 当 等 。 
(18) 静态 数据 设计 一 一 静态 数据 结构 〈 例 如 存放 位 置 ， 分 区 和 元 余 ) 设计 不 当 。 
(19) 未 知 交互 一 一 与 其 他 功能 或 者 其 他 系统 的 组 件 之 则 的 未 知府 扯 。 
(20) 意外 依赖 一 一 对 其 他 系统 组 件 意料 之 外 的 依赖 性 或 者 和 其 他 组 件 的 意料 之 外 的 互动 。 
(21) 并 发 工作 一 一 对 其 他 版 本 中 正在 做 的 工作 有 意料 之 外 的 依赖 性 。 
(22) 其 他 一 一 请 拉 述 该 故障 。 
O 如 采 故 障 是 一 个 病 钙 ， 请 尝试 找 出 诱发 这 个 这 个 病症 的 座 层 原因 。 
(1) 未 给 出 一 一 未 能 给 出 深层 的 原因 。 
(2) 不 完整 /遗漏 的 需求 一 由 于 不 完整 或 者 未 声明 的 需求 造成 了 故障 。 


























的 意思 来 实现 。 

(4) 不 完整 /遗漏 的 设计 一 一 由 于 不 完整 或 者 未 声明 的 设计 规范 造成 了 故障 。 

(5) 模棱两可 的 设计 一 一 设计 规范 不 严 说， 可 以 解读 出 不 同 的 意思 ， 最 后 没 能 按照 正确 的 
意思 来 实现 。 

(6) 早 前 修复 不 当 一 一 故障 是 在 解决 早 前 的 错误 时 处 理 不 当 造 成 的 〈《 即 故障 并 非 由 新 的 开 
发 造成 )。 

(7) 认识 不 足 一 一 有 些 东 西 本 来 是 需要 我 来 了 解 的 ， 但 我 没 意 识 到 。 


(8) 错误 的 修改 一 一 我 怀疑 提交 的 故障 解决 方案 有 误 , 但 是 我 不 确定 怎样 来 正确 地 解决 它 。 

(9) 被 迫 提 交 方 案 一 由 于 受到 压力 〈 通 前 是 来 自 于 时 间 安 排 上 的 压力 ) 而 不 得 不 在 明知 
解决 方案 有 误 的 情况 下 强行 提交 。 

(10) 其 他 一 一 请 阐述 原因 。 


O 对 于 这 个 故障 ， 考 夸 可 能 的 预防 措施 ， 并 在 下 面 的 列表 中 选择 一 个 最 有 用 或 者 最 合适 的 。 
(1) 更 规范 的 需求 一 一 用 正规 的 表示 法 (可 以 古文 字 或 图 示 ) 精确 而 清楚 地 表述 需求 (或 
者 设计 ) 信息 。 
(2) 提供 需求 /设计 模板 一 一 提供 更 详细 的 需求 /设计 文档 模板 。 
(3) 更 规范 的 接口 规格 一 一 使 用 正规 的 表示 法 来 拍 述 模块 接口 。 
(4) 提供 培训 一 一 提供 研讨 会 、 讲 座 以 及 正规 培训 课程 。 
(5) 进行 程序 演练 一 一 大 致 确定 程序 进程 及 数据 对 象 间 的 互动 。 
(6) 提供 专业 人 士 /文档 一 一 当 需 要 时 提供 一 位 专业 人 士 或 者 清晰 的 专业 文档 。 
(7) 使 设计 /代码 编写 同步 一 一 保证 设计 文档 和 当前 代码 的 一 致 性 。 
(8) 严格 执行 准则 一 一 严格 执行 代码 审查 以 及 使 用 静态 代码 分 析 工 具 ， 如 lint。 
(9) 更 好 的 测试 安排 一 一 提供 更 好 的 测试 计划 及 更 好 地 进行 执行 (如 自动 回归 测试 )。 
(10) 其 他 一 一 请 说 明 其 他 预防 的 办 法 。 
被 调查 者 为 目 己 的 回答 的 目 信 和 度 打分 ， 按 顺序 分 别 是 : 非 第 高 ， 高 ， 中 ， 低 ， 非 常 低 。 我 们 
排除 了 少量 日 信 度 为 低 或 者 非常 低 的 调查 结 示 。 
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25.4.2 ”统计 分 析 


我 们 收 到 了 68% 的 问卷 回复 ， 并 排除 了 6% 的 “ 低 ”或 者 “非常 低 ” 目 信 度 的 回答 。 对 剩余 的 
问卷 , 我 们 使 用 卡 方 (Chi-square) 分 析 法 ”来 测试 各 个 配对 数据 组 之 间 的 独立 性 (或 者 相关 性 )。 
在 用 卡 方 分 析 法 中 ，Xx 越 低 就 代表 着 数据 相互 旧 越 独立 ， 越 高 则 代表 越 相互 依赖 。 而 p 值 则 代表 
数据 的 显著 性 p 值 越 低 ， 那 么 我 们 分 析出 的 结 琳 纯 属 巧合 的 可 能 性 就 越 小 。 在 表 25-2 中 我 们 可 
以 看 到 ， 预 防 措 施 和 故障 寻找 难度 的 联系 最 不 紧密 (他们 的 x 值 最 低 )， 而 且 这 种 不 紧密 性 有 很 
高 的 显著 性 〈(p 值 低 于 0.05 代 表 着 只 有 不 到 1/20 的 几率 这 种 相互 独立 的 关系 是 因为 巧合 ) 。 故 障 类 
型 和 故 隐 成 因 ,， 故障 类 型 和 故障 预防 , 还 有 故障 成 因 和 故障 预防 这 三 对 数据 的 相互 关联 性 最 为 基 
密 。 我 们 观察 到 他 们 的 和 2 值 是 本 次 调查 中 最 高 的 三 个 ， 而 且 显 著 性 非常 之 高 (只 有 不 到 1/10000 
的 几率 是 因为 巧合 )。 

这 三 对 数据 的 紧密 联系 古 好 事 ， 因 为 : (1) 故障 确实 应 该 和 其 成 因 密切 相关 ;， (2) 故障 类 型 和 
成 因 也 确实 应 该 和 预防 措施 紧密 相关 。 这 表明 接受 问卷 调查 者 的 回复 是 前 后 一 致 并 合乎 逻辑 的 。 


表 25-2 ” 卡 方 分 析 总 结 











数 据 组 自 由 度 4 p 

发 现 ， 解 决 6 51.489 0.0001 
类 型 ， 发 现 63 174.269 0.0001 
类 型 ， 解 决 63 204.252 0.0001 
成 因 ， 发 现 27 94.493 0.0001 
成 因 ， 解 决 27 55.232 0.0011 
类 型 ， 成 因 189 403.136 0.0001 
预防 ， 成 因 27 41.021 0.041 
预防 ， 解 决 27 97.886 0.0001 
类 型 ,预防 189 492.826 0.0001 
成 因 ， 预 防 81 641.417 0.0001 


1. 发 现 和 解决 故障 
表 25-3 展 示 了 发 现 及 解决 设计 /代码 编写 故障 的 难度 。 其 中 ，78% 只 需 $ 天 以 下 即 可 解决 。 总 
的 来 说 ， 容 易 找 到 的 故障 就 比较 容易 修复 ， 越 难 找 到 的 故障 就 越 难 解决 。 


表 25-3 ” 找 出 和 解决 故障 的 时 间 对 比 


找 出 /解决 < 1 天 1 一 5 天 6 一 30 天 > 30 天 
30.1% 48.8% 18.0% 3.6% 
容易 67.5% 23.7% 32.1% 10.0% 1.7% 
中 等 23.4% 4.2% 12.5% 5.6% 1.1% 
困难 7.7% 1.7% 3.4% 2.1% 0.5% 


非常 困难 1.4% 0.5% 0.3% 0.3% 0.3% 
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卡 方 分 析 法 的 一 个 有 趣 之 处 是 : 分 析 结 果 是 基于 配对 数据 的 “预期 值 ” 和 观察 到 的 “实际 值 ” 
之 间 的 差别 。 在 这 次 的 分 析 中 ， 预 期 值 是 “ 找 出 ”的 百分比 和 “解决 ”百分比 的 乘积 。 如 果 这 两 
个 数据 互 无 关系 ,那么 我 们 的 预期 值 将 等 于 或 者 非常 接近 于 观察 到 的 实际 值 ， 否则 这 两 组 数据 便 
有 关联 。 

第 一 行 的 数据 是 我 们 观察 到 的 故障 解决 时 间 的 百分比 , 而 第 一 列 是 找 出 和 重 现 故 障 的 难度 的 
百分比 。 故 障 是 “容易 找 出 ”并 且 “ 可 以 在 1 天 内 解决 ”的 预期 可 能 性 是 67.1% x 30.1% = 20.2%, 
而 实际 观察 到 的 结果 是 23.7%， 比 预期 值 多 了 17%。 

观察 到 的 结果 是 容易 找 出 并 可 以 在 1 天 内 解决 的 故障 比分 析出 来 的 预期 要 多 。 但 有 趣 的 是 ， 
故障 是 “容易 找 出 ”并 “需要 6 一 30 天 解决 ”的 实际 比率 (10%) 却 比 预期 比率 (12%) 要 少 。 

虽然 表 25-3 中 不 同 的 “发 现 故 障 的 难度 ”和 “解决 故障 的 时 间 ” 的 数据 相互 之 间 不 具备 可 比 
性 , 但 我 们 还 是 发 现 了 一 个 耐人寻味 的 关联 。 把 表 中 的 多 项 数据 合并 之 后 我 们 发 现 了 一 个 有 意思 
的 现象 ， 在 表 25-4 中 体现 。 这 似乎 正好 推翻 了 那 名 老话 “问题 一 旦 找到 了 ， 解 决 起 来 就 容易 了 ”。 
有 很 大 一 部 分 找 出 难度 是 “容易 /中 等 ”的 故障 需要 较 长 的 时 间 来 修复 。 


表 25-4 “寻找 /解决 难度 总 结 表 








找 出 /解决 难度 入 5 天 二 6 天 

容易 /中 等 72.5% 18.4% 

PR] AEG Ee PR XE 5.9% 3.2% 
2. 故障 


K25-59 H T AERA, FRM HE. WEEL, REE TRIIR A H 
吕 来 表示 故障 类 型 。 

前 五 种 故障 占 到 了 总 数 的 67%。 内 部 功能 类 故障 的 数量 遥遥 领先 , 让 人 有 些 意 外 , 但 “ 接 
口 复杂 度 ” 征 一 个 严重 的 问题 却 是 在 意料 之 中 。 不 过 总 的 来 说 ,这样 一 些 故 隐 排 在 前 列 还 是 合 乎 
这 个 系统 的 发 展 特性 的 。 在 发 展 中 ， 系 统 被 加 入 了 大 量 的 新 功能 ， 很 容易 引发 “内 部 功能 、“ 底 
REE ”及 “外 部 功能 ”类 故障 。 

这 个 实时 系统 规模 巨大 且 极 其 复杂 ， 所 以 我 们 不 难 理解 在 开发 中 为 什么 会 出 现 “ 接 口 复 杂 
RE”, 意外 的 依赖 性 ， “设计 /代码 编写 的 复杂 性 ， 变更 协调 ”和 “并 发 的 工作 ”等 故 隐 。 

C 语 言 有 一 些 为 人 熟知 的 “语言 陷阱 ”, 造成 了 列表 中 游 的 菜 些 故障 。 比 如 “和 争 用 情况 ”就 古 
因为 C 语 言 不 具备 未 些 语 言 特性 而 造成 的 严重 问题 。 

性 能 ”相对 来 说 不 是 一 个 重大 的 问题 。 这 大 概 征 由 于 我 们 分 析 的 这 个 版 本 已 经 是 一 个 成 熟 
的 发 行 版 本 的 原因 。 此 外 ， 代码 检查 的 时 候 也 会 着 重 注 意 检 查 性 能 问题 , 这样 性 能 所 引发 的 故障 
就 不 会 很 多 了 。 

3. 用 工作 量 权衡 后 的 故障 频率 

在 对 故障 排序 的 时 候 ， 有 两 个 重要 的 问题 需要 我 们 考虑 : 故障 的 检测 难度 对 排序 的 影响 ， 以 
及 故 隐 的 解决 难度 对 排序 的 影响 。 给 列表 中 的 故障 类 型 加 上 权重 可 以 让 我 们 用 故障 的 检测 及 解决 
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难度 来 修正 我 们 此 前 的 排序 。 仅 从 “不 浪费 任何 数据 ”的 角度 来 看 ， 政 障 的 频率 确实 可 以 作为 一 
个 判断 其 重要 性 的 和 钾 级 指标 。 表 25-5 列 出 了 各 个 故障 类 型 ， 并 按照 频率 排列 。 


表 25-5 ”故障 类 型 〈 按 频率 排列 ) 


故障 类 型 频率 % 故障 描述 
5 25.0% 内 部 功能 
10 11.4% OERE 
20 8.0% 意外 的 依赖 性 
3 7.9% 底层 逻辑 
11 7.7% 设计 /代码 复杂 度 
22 5.8% 其 他 
9 4.9% 变更 协调 
21 4.4% 并 行 的 工作 
13 4.3% 争 用 情况 
6 3.6% 外 部 功能 
1 3.5% 语言 陷阱 
12 3.3% i ER ADEE 
7 2.4% 原始 数据 类 型 误 用 
17 2.1% 动态 数据 使 用 
15 1.5% 资源 分 配 
18 1.0% 静态 数据 设计 
14 0.9% 性 能 
19 0.7% 未 知 的 交互 
8 0.6% 原始 数据 类 型 不 支持 
2 0.4% 协议 
4 0.3% CMS 复杂 度 
16 0.3% 动态 数据 设计 








在 表 25-6 中 我 们 答 试 将 不 同 故障 的 检测 难度 用 权重 表示 出 来 。 计 算 权 重 的 方法 征 将 难度 从 多 
到 难 分 为 1、2、3、4， 分 别 乘 以 该 难度 所 对 应 的 百分比 ， 再 汇总 。 

很 明显 ， 如 采 我 们 有 更 详细 的 故障 检测 所 花费 的 时 间 数 据 ， 并 按照 该 数据 调整 权重 值 (正如 
接 下 来 我 们 分 析 故 障 修 复 时 间 数 据 时 要 做 的 )， 也 就 是 说 ， 我 们 所 算出 来 的 检测 难度 
权重 值 具 备 参考 性 ， 但 不 能 单独 依靠 这 些 数据 得 出 结 

我 们 答 试 了 多 种 不 同 的 权重 方案 ， 结果 大 同 小 异 所 以 我 们 选择 了 这 个 最 简单 的 方案 

如 末 对 于 每 一 个 故障 都 有 相关 的 花费 时 间 数 据 ， 那 我 们 便 能 对 其 难度 有 更 切实 的 感受 。 但 这 
类 数据 很 少见 ， 所 以 我 们 只 能 用 一 些 估计 的 数据 来 代 禁 。 

华 例 来 说 ， 如 条 对 于 菏 个 种 类 故障 的 检测 ，66% 属 于 容 多 发 现 ，23% 中 等 ，11% 困 难 ，0% 非 
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季 困 难 ， 那 么 其 权重 即 是 : 145=(66 x 1)+(23 x 2)+(11 x 3)+(0 Xx 人。 表 25-6 展 示 的 是 经 过 了 权衡 以 
后 的 各 种 故障 的 检测 难度 ， 按 从 了 最 简单 到 最 困难 的 顺序 排列 。 


表 25-6 ”故障 检测 难度 权重 值 一 览 


故障 类 别 百分比 ( 易 /中 / 难 /很 难 ) 权 重 故障 描述 
4 100/0/0/0 100 CMS 复杂 度 
18 100/0/0/0 100 静态 数据 设计 
7 88/8/4/0 120 原始 数据 类 型 误 用 
2 75/25/0/0 125 协议 
20 78/16/S/1 129 意外 的 依赖 性 
pA 70/23/2/4 130 并 行 的 工作 
3 73/22/5/0 132 底层 逻辑 
22 82/12/2/5 132 其 他 
5 74/19/6/1 134 内 部 功能 
6 67/31/3/0 139 外 部 功能 
l 68/26/2/2 141 语言 陷阱 
10 66/23/11/0 145 接口 复杂 度 
9 65/20/12/2 149 变更 协调 
8 67/17/17/0 152 原始 数据 类 型 不 支持 
19 88/8/4/0 157 未 知 的 互动 
16 67/0/33/0 157 动态 数据 设计 
7 52/38/10/0 158 动态 数据 使 用 
15 47/47/7/0 162 资源 分 配 
12 55/30/12/3 163 i ERD EH 
11 §5/29/16/1 165 代码 复杂 度 
14 §6/11/11/22 199 PERE 
13 12/67/21/0 209 争 用 情况 


一 般 来 说 ， 性 能 和 “和 争 用 情况 ”这 两 种 问题 比较 难以 分 离 和 重 现 。 可 以 预见 的 是 ，“ 代 码 
复杂 度 和 “错误 处 理 ”类 的 故障 也 会 很 难 检 汕 和 重 现 。 此 外 ,， 语言 陷阱 ”和 “接口 复杂 度 
类 故障 都 比较 难 检测 。 

从 卡 方 分 析 法 的 结果 看 来 ,，“ 内 部 功能 、 意外 的 依赖 关系 ”和 “其 他 ”类 的 故障 往往 比 预 
想 的 要 容易 检测 ， 而 “代码 复杂 度 和 “性 能 类 故障 则 毅 贡 比 预想 的 更 难 检 测 。 当 被 调查 故 隐 
的 数量 增 大 ， 预 期 和 实际 的 差异 也 就 变 得 越 来 越 明 显 。 
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如 采 我 们 用 刚刚 算出 的 权重 去 权衡 表 25-5 中 的 频率 数据 ， 故 障 的 排序 并 不 会 有 什么 大 的 变 
化 。 只 有 “内 部 功能 、“ 代 码 复 杂 度 ”和 “第 用 条 件 ”( 编 号 分 别 为 5，11，13) 三 类 故障 的 顺序 
稍微 有 些 改变 。 

表 25-7 列 出 了 用 实际 花费 时 间 来 权衡 之 后 ， 解 决 各 类 故障 的 难度 。 我 们 用 1，3，15，30 作 为 
平均 时 间 值 ， 并 以 此 作为 权重 ， 而 计算 方法 则 仍 按照 此 前 计算 故障 检测 时 间 的 权重 的 方法 。 

在 用 解决 故障 的 时 间 做 权重 之 后 ， 故 区 的 排序 起 了 一 些 有 趣 的 变化 。 “T SPAR”, “Re 
辑 和 “内 部 功能 ”类 故障 的 排名 剧 末 下降。 这 和 我 们 对 这 几 类 故障 的 直观 感觉 正好 一 致 。 设 
计 / 代 码 复杂 度 、“ 资 源 分 配 ” 和 “意外 的 依赖 性 ”类 故障 (编号 11，15，20) 的 排名 强力 上 升 。 
-接口 复杂 度 、“ 和 争 用 情况 ”和 “性 能 ”类 故障 〈 编 号 10，13，14) 的 排名 也 有 一 定 上 升 。 


表 25-7 ”故障 修复 难度 权重 值 一 览 





故障 类 别 百分比 ( 易 /中 / 难 /很 难 ) 权 Ẹ 故障 描述 
16 67/33/0/0 166 动态 数据 设计 
4 67/33/0/0 166 CMS 复杂 度 
8 50/50/0/0 200 原始 数据 类 型 不 支持 
18 50/50/0/0 200 静态 数据 设计 
1 63/31/6/0 244 语言 陷阱 
3 59/37/3/1 245 底层 逻辑 
2 25/75/0/0 250 协议 
17 38/48/14/0 392 动态 数据 使 用 
9 37/49/14/0 394 变更 协调 
5 27/59/14/0 414 内 部 功能 
22 40/43/12/5 496 其 他 
7 46/37/8/8 497 原始 数据 类 型 误 用 
10 17/57/26/1 608 接口 复杂 度 
21 25/43/30/2 661 并 行 的 工作 
6 22/50/22/6 682 外 部 功能 
13 16/56/21/7 709 争 用 情况 
12 21/52/18/9 717 i ERD EH 
19 29/43/14/14 785 未 知 的 互动 
20 24/39/33/5 786 意外 的 依赖 性 
11 22/39/27/12 904 设计 /代码 复杂 度 
14 11/22/44/22 1397 性 能 


15 0/47/27/27 1356 资源 分 配 
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表 25-8 列 出 了 经 过 权重 之 后 的 ， 最 难 解 决 的 四 种 故障 。 根 据 我 们 的 权重 方 染 ,这 四 种 故障 消 
耗 了 55.2% 的 故障 解 决 时 间 ， 以 及 51% 的 故障 检测 时 间 ， 从 数量 上 来 说 占 了 总 数 的 52.1%。 总 的 来 
说 ,这 些 夏 障 较 容易 找 出 但 是 较 难 解决 。 虽然 故障 的 “检测 难度 ”和 “修复 难度 ”这 两 个 难度 严 
格 来 说 并 不 具备 可 比 性 ， 但 发 现 这 样 的 一 致 性 还 是 很 有 趣 的 。 


表 25-8 ”最 难 修复 的 故障 〈 权 重 后 ) 


故障 类 别 权重 后 的 % 故障 描述 
> 18.7% 内 部 功能 
10 12.6% 接口 复杂 度 
12.6% 代码 复杂 度 
A 11.3% 意外 的 依赖 性 


从 卡 方 分 析 的 结 琳 来 看 ,，“ 语 言 陷 阱 ”和 “底层 逻辑 ”类 故障 比 起 预期 需要 更 少 的 时 间 来 解 
决 。 接口 复杂 度 ”和 “内 部 功能 类 故障 比 起 预期 更 经 名 在 1 到 6 天 内 解决 ,而 “设计 /代码 编写 
和 “意外 的 依赖 性 ” 带 来 的 故障 常 需 要 更 多 的 时 间 〈《 即 6 到 30 天 ) 来 解决 。 这 些 偏 差 巩 固 了 给 故 
障 修 复 难 度 加 上 权重 的 重要 性 。 

4. 深层 的 诱因 

在 表 25-9 中 ， 我 们 列 出 了 各 类 故障 的 诱因 ， 并 把 它们 按照 未 经 权衡 的 频率 排列 。 


表 25-9 故障 的 深层 诱 








故障 类 别 频率 % 故障 描述 

4 25.2% 动态 数据 设计 

1 20.5% 未 给 出 

7 17.8% 认识 不 足 

5 9.8% 模 校 两 可 的 设计 
6 7.3% 时 前 修复 不 当 

9 6.8% 迫 于 压力 提交 

2 5.4% 不 完整 /遗漏 的 需求 
10 4.1% 其 他 

3 2.0% 模棱两可 的 需求 
8 1.1% 背 误 的 修改 


对 于 “未 给 出 ”分 类 的 高 频率 我 们 有 必要 解释 一 下 。 其 一 古 因 为 “语言 陷阱 、 SRAZI 、 
“和 争 用 情况 ”和 “变更 协调 ”这 些 既 是 故障 的 类 型 又 古 故 障 发 生 的 原因 ， 所 以 在 选择 这 些 的 故障 
REDS, REEKSE “未 给 出 《在 未 给 出 原因 的 故障 中 有 7.8% 属 于 这 类 故障 )。 除 此 之 
外 ， 还 有 一 些 故障 类 型 ， 如 “接口 复杂 度 ” 和 “设计 /代码 复杂 度 ” 也 可 以 看 作 既 是 故障 的 类 型 
又 征 故 障 发 生 的 原因 。 不 过 ， 有 相当 一 部 分 的 “内 部 功能 ”类 故障 未 能 给 出 这 层 的 原因 ， 这 一 点 
让 我 们 很 意外 。 这 类 故障 一 般 来 说 应 该 是 能 找到 发 生 原 因 的 。 
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表 25-10 列 出 了 各 个 深 层 诱 因 所 5| 发 故障 四 检测 难度 权重 。 结 末 和 我 们 的 直 宽 完全 相反 : 未 
给 出 原因 的 故障 是 第 二 难 检 测 出 的 故障 ， 而 “被 过 提交 ”的 故障 最 难 被 检测 出 来 。 


表 25-10 ”深层 诱因 的 检测 难度 权重 


深层 诱因 A 分 kk NM Ẹ 故障 描述 
91/9/0/0 109 HE TEL EK] (Be Ue 
7 74/18/7/1 135 认识 不 足 
3 60/40/0/0 140 模棱两可 的 需求 
5 66/27/7/0 141 模棱两可 的 设计 
2 70/17/13/0 143 不 完整 /遗漏 的 需求 
4 68/25/7/1 143 不 完整 /遗漏 的 设计 
6 73/12/0/12 147 早 前 错误 的 修改 
10 76/12/0/12 148 其 他 
l 63/25/11/1 150 未 给 出 
9 50/46/4/0 158 被 迫 提交 





从 对 座 层 诱因 的 检测 难度 权重 的 证 方 分 析 结 末 来 看 , 由 “认识 不 足 ”引发 的 故障 间 冲 比 预 期 
的 更 容易 找 出 ， 而 要 找 出 由 “被 迫 提 交 ”5| 发 的 赦 障 弟弟 比 预 期 要 稍 难 一 些 。 后 一 个 发 现 很 有 意 
思 ， 因 为 我 们 对 “被 迫 提 交 ”的 故障 几乎 一 无 所 知 。 

在 表 25-11 中 ,我 们 计算 了 深层 诱因 的 修复 难度 权重 。 新 的 排列 顺序 产生 了 一 些 变 化 ， “不 完 
警 /遗漏 的 设计 上 升 了 很 多 ，“ 模 楼 两 可 的 知 求 ”和 “不 完整 /站 漏 的 需求 ”上 升 『 一 些 ，' 未 给 
出 ”下 降 了 很 多 ,“ 不 清晰 的 设计 ”和 “其 他 ”下 降 了 一 些 。 不 过 ， 各 个 深层 诱因 的 相对 排名 并 
设 有 什么 变化 。 





表 25-11 根据 修复 难度 加 权 的 深层 诱因 


深层 诱因 百 分 比 权 重 故障 描述 
10 37/42/12/10 340 其 他 
| 43/43/12/2 412 未 给 出 
5 29/55/14/2 464 模棱两可 的 设计 
7 30/50/17/3 525 认识 不 足 
6 34/45/17/4 544 早 前 错误 的 修改 
9 18/57/25/0 564 被 迫 提交 
8 18/55/27/0 588 背 误 的 修改 
4 23/50/22/5 653 不 完整 /遗漏 的 设计 
26/44/24/6 698 不 完整 /遗漏 的 需求 
3 25/30/24/6 940 模棱两可 的 需求 
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这 个 根据 修复 难度 加 权 的 排名 正好 和 人 有 的 直 完 相 科 。 


对 深 层 诱因 的 修复 难度 权重 的 卡 方 分 析 显 示 ，“ 示 给 出 原因 ”的 故障 比 预期 花费 更 少 的 时 间 来 
修复 ， 而 由 “不 完整 / 壮 泌 的 设计 ”和 “被 迫 提 交 ” 造 成 的 故障 通 第 需要 超过 预期 的 时 间 来 修复 。 
在 表 25-12 中 ， 我 们 用 交 又 表格 来 展示 各 类 故障 及 其 深层 诱因 的 数据 。 横 排 是 各 类 故障 ( 表 
AEM), 纵 列 是 各 种 故障 发 生 的 深层 原因 (用 表格 上 方 数字 表示 )。 表 中 的 数字 代表 着 所 占 总 数 
的 百分比 。 也 就 是 说 ，1.5% 的 故 隐 是 语言 陷阱 类 故障 〈 即 1 号 故障 ) ， 由 1 弓 原 因 造 成 。 要 计算 其 
预 值 百 分 比 可 以 将 1 过 故障 百分比 和 1 所 原 因 的 昕 分 比 相 乘 , 即 : 20.5% x 3.5% =0.7%, 也 束 古 说 ， 





实际 观察 到 的 结 末 比 预期 要 高 。 


表 25-12 ”故障 及 深层 诱因 
1 2 3 4 5 6 
20.5% 5.4% 2.0% 25.2% 9.8% 7.3% 


1. 语言 陷阱 3.5% 1.5 0 0 0.2 0.1 0.2 
2. 协议 0.4% 0 0 0.1 0.2 0 0 
3. 底层 逻辑 7.9% 3.7 0.3 0.1 0.6 0.3 1.2 
4. CMS 复杂 度 0.3% 0.1 0 0 0 0 0.1 
5. 内 部 功能 25.0% 3.3 1.3 0.6 7.7 2.8 2.0 
6. 外 部 功能 3.6% 0.7 0.3 0.1 0.4 0.5 0.6 
7. 原始 数据 类 型 误 用 2.4% 0.4 0 0 0.5 0 0.1 
8. 原始 数据 类 型 不 支持 0.6% 0 0.2 0 0.1 0 0.1 
9. 变更 协调 4.9% 1.1 0 0 0.8 1.0 0.6 
10. 接口 复杂 度 11.4% 2.1 0.6 0.2 4.1 1.4 1.1 
11. 设计 /代码 复杂 度 7.7% 1.3 0 0.3 3.0 1.6 0.2 
12. 错误 处 理 3.3% 0.9 0.3 0 0.8 0 0.1 
13. 争 用 情况 4.3% 1.4 0.2 0 1.3 0.5 0.1 
14. PERE 0.9% 0.2 0 0.1 0.2 0 0 
15. 资源 分 配 1.5% 0.5 0 0 0.3 0.1 0 
16. 动态 数据 设计 0.3% 0 0 0 0.1 0 0 
17. 动态 数据 使 用 2.1% 0.7 0.1 0 0.2 0.1 0 
18. 静态 数据 设计 1.0% 0.3 0.1 0.1 0.2 0.1 0 
19. 未 知 的 互动 0.7% 0 0.1 0.1 0 0.2 0 
20. 意外 的 依赖 性 8.0% 0.5 0.8 0.3 2.7 0.5 0.1 
21. 并 行 的 工作 4.4% 0.6 0.3 0 12 0.2 0.4 


22. 其 他 5.8% 1.2 0.8 0 0.6 0.4 0.4 


7 


17.8% 


0.8 
0.1 
0.7 
0.1 
Ja 
0.7 
0.8 
0.1 
0.8 
1.4 
1.0 
0.7 
0.3 
0.3 
0.4 
0.1 
0.6 
0.1 
0.2 
1.4 
0.9 


1.1 


8 


1.1% 


0.1 
0 
0 


0.3 


0.1 


0.2 


0.2 


0.1 


9 
6.8% 


0.5 
0 
0.6 


25.4 第 二 阶段 : 设计 /代码 编写 类 故障 调查 353 


为 简洁 起 见 ， 我 们 只 列 出 了 最 常见 的 故障 造 成 这 些 故 障 的 最 主要 的 一 些 深层 原因 。 不 完 
整 /被 省 略 的 设计 ”(4 马 原因 ) 是 所 有 列 出 故障 的 最 主要 成 因 。 “模棱两可 的 设计 ”(5 号 原因 )， 
“知识 不 足 ”(7 号 原因 ) 和 “未 给 出 ”(1 号 原因 ) 也 十 造成 故障 的 重要 原因 。 

e 0000000 SU 

统计 显示 ，“ 不 完整 /遗漏 的 设计 ”( 原 因 5) 被 认为 引发 了 31% 的 内 部 功能 类 故障 ， 比 预 

计 的 高 1 个 自分 点 。 认识 不 足 ”( 原 因 7) 被 认为 引发 了 21% 的 内 部 功能 类 故障 。 未 给 出 - 

征 第 三 多 的 深层 原因 ， 引 发 了 13% 的 此 类 故障 。 

e 00000000100 

5 | Ae HEE Ee ERR TA UA AHE, re Dai, 36%, 

比 预期 要 高 。“ 认识 不 足 ” 和 “模棱两可 的 设计 ”被 认 作 是 第 二 和 第 三 的 主要 原因 ， 分 别 占 

13% 和 和 12%。 

e 00000000 O 20 

不 出 意料 ， 不 完整 /遗漏 的 设计 被 认为 是 引发 这 类 故 隐 的 主要 原因 , 占 34%。 “ME te 

交 (原因 9) 引发 了 21% 的 此 类 故障 ， 比 预期 高 1 个 百分点 。 “认识 不 足 ” 征 第 三 大 诱因 ， 引 

发 了 18% 的 此 类 故障 。 

*HUUUUUUUUO HE 

LE, “ANGER IRE BT” RANER hE EG A, 39%, EL Te 

个 百分点 。 IRAI re WL AURAL, H2 ARR Eo, TEE TU 

HIS AD. 未 给 出 ” 古 第 三 大 诱发 原因 ， 占 17%。 

仍然 是 为 了 简洁 起 见 ， 我 们 只 学 虑 最 第 出 现 的 深层 诱因 及 这 些 原因 所 5 发 的 故障 。 

*HUUUUUUUUU0U 4 

我 们 之 前 留意 到 ,，“ 内 部 功能 、 接口 复杂 度 、 代码 /设计 复杂 性 和 RD RE” 

古 由 这 个 原因 造成 的 主要 故障 (分别 占 31%，12%，12% 和 11%)， 前 三 者 都 比 预期 的 要 高 。 

*HUUUUU 1 

“JERR” (WE) 是 最 主要 的 故障 ， 占 这 个 原因 所 引发 故障 总 数 的 18%， 比 预期 高 1 

个 百分点 。 内 部 功能 ” (故障 5) 是 第 二 大 的 故障 ， 占 16%， 比 预期 低 1 个 百分点 。 接口 复 

杂 度 ” (故障 10) 和 是 第 三 大 故障 ， 占 10%。 语言 陷阱 ”和 是 第 四 大 故障 ， 占 8%， 比 预期 高 1 个 

AD hie 

e 000000070 

“内 部 功能 ”类 故障 是 最 多 的 故障 ， 占 29%， 比 预期 高 1 个 百分点 。 接口 复杂 度 ” 第 二 ， 

占 8%， 比 预期 低 1 个 百分点 。 意外 的 依赖 性 ”第 三 ， 占 8%。 其 他 ”( 故 隐 22) 第 四 , 占 6%。 

e 000000000 SU 

-内 部 功能 ”类 故障 最 多 ， 占 29%。 “代码 /设计 复杂 性 ”( 故 障 11) 第 二 ， 占 16%， 比 预 
期 高 1 个 百分点 。 “接口 复 杂 度 ”第 三 ， 占 14%。 “变更 协调 ”第 四 ， 占 10%， 比 预期 高 1 个 百 
BS Fh 








— 
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5. 预防 措施 
表 25-13 按 出 现 频率 列 出 了 各 个 预防 措施 。 我 们 发 现 这 些 结 果 可 能 较 好 地 反应 了 被 调查 者 选 
择 措 施 的 方法 。( 例 子 请 参见 本 节 稍 后 关于 正式 和 非 正 式 的 预防 措施 的 讨论 ,) 


表 25-13 ”故障 的 预防 措施 





预防 措施 频率 % 昔 施 描述 

5 24.5% 程序 演练 

6 15.7% 专业 人 士 /文档 

8 13.3% PRESTEM] 

2 10.0% 需求 /设计 模板 

9 9.9% 更 好 的 测试 安排 
l 8.8% 更 正规 的 需求 

3 7.2% 更 正规 的 接口 规格 文档 
10 6.9% 其 他 

4 2.2% 培训 

J 1.5% 设计 /代码 并 发 性 


有 趣 的 是 我 们 广 意 到 特定 于 该 应 用 程序 的 预防 措施 ( 即 “ 程 序 演练 ”) 被 认为 是 最 有 效 的 措 
施 。 这 个 将 程序 演练 选择 为 最 有 用 的 故障 预防 措施 正好 印证 了 Curtis ，Krasner 和 Iscoe “的 观察 ， 
即 在 大 型 系统 的 开发 中 最 大 的 问题 是 对 程序 的 认 知 不 足 。 

此 外 , 值得 注意 的 是 非 正 式 的 措施 排 在 了 正式 措施 的 前 面 。 一 方面 ， 这 也 许 反 映 了 美国 人 对 
于 正式 措施 的 一 贯 俩 见 。 而 另 一 方面 ， 非 正式 措施 代表 着 非 技 术 类 的 解决 方案 。 虽 然 正式 的 措施 
也 能 够 用 技术 手段 达到 类 似 的 效果 ， 但 是 可 能 维护 的 成 本 就 更 高 了 。 

各 将 这 些 措施 所 对 应 故障 按 检 测 工作 量 来 排序 ， 结 有 末 和 表 25-13 中 的 顺序 并 无 甚 区别。 只 
两 个 例外 ， 一 个 是 “需求 /设计 模板 ”， 其 对 应 的 故障 似乎 比 预计 更 容易 找到 ， 另 一 个 是 “严格 遵 
守 准 则 ， 其 对 应 的 故障 似乎 比 预计 更 难 找到 。 

在 卡 方 分 析 的 结果 中 ， 故 障 的 检测 和 预防 是 最 为 相互 独立 的 关系 ，p = 0.041, “程序 演练 ” 
对 应 的 故障 检测 要 比 预 期 的 稍微 容易 一 些 ， 而 “严格 执行 崔 则 ”对 应 的 故障 比 预期 的 更 难 检测 。 

在 表 25S-14 中 ， 我 们 用 故障 修复 的 时 间 来 计算 预防 措施 的 权重 。 


表 25-14 ”预防 措施 的 故障 修复 时 间 权 重 一 览 








预防 措施 百分比 〈 易 /中 / 难 /很 难 ) 权 重 音 施 描述 
8 38/52/7/3 389 严格 执行 准则 
9 35/52/12/1 401 更 好 的 测试 安排 
7 40/40/20/0 460 设计 /代码 并 发 性 
5 33/50/17/1 468 程序 演练 
10 49/36/6/9 517 其 他 





2 10/52/30/1 654 需求 /设计 模板 
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( 续 ) 
预防 措施 百分比 ( 易 /中 / 难 /很 难 ) XN 重 昔 施 描述 
3 26/43/26/4 675 更 正规 的 接口 规格 文档 
6 22/48/24/6 706 专业 人 士 / 文 档 
l 20/50/22/8 740 更 正规 的 需求 
4 23/36/23/18 1016 培训 


一 个 有 趣 的 发 现 是 , 被 认为 通过 培训 就 能 预防 的 故障 症 最 难 解 决 的 。 而 正式 的 预防 措施 对 应 
的 大 都 是 需要 很 长 时 间 才 能 解决 的 故障 。 

在 用 故障 修复 时 间 加 权 之 后 ， 预 防 措施 的 比例 有 了 一 些 变化 :“ 程 序 演练 ， 更 好 的 测试 安 
排 ” 和 “严格 执行 准则 ”在 比例 上 都 下 降 了 ; “专业 人 士 / 文 档 ” 和 “更 正规 的 需求 ” 上升 了 “更 
正式 的 接口 规格 文档 ”和 “其 他 ”也 上 升 了 少许 。 结 来 就 是 ， 原 来 的 排序 (5S, 6, 2, 1, 8, 10, 
3，9，4，7) 有 了 这 些 变 化 :“ 专 业 人 十 /文档 ”和 “更 正规 的 需求 ”( 编 号 6 和 11) 的 排名 上 升 了 
很 多 ;“ 需 求 /设计 模板 "、“ 更 正规 的 接口 规格 文档 "、“ 培 训 ” 和 “其 他 ”( 编 号 2、3、4 和 110) 上 
升 了 少许 ;，“ 严 格 执行 准则 ”和 “更 好 的 测试 安排 ”( 编 号 8 和 9) 下 降 了 很 多 。 

卡 方 分 析 的 结 来 显示 ,，“ 程 序 演练 “、“ 严格 执行 准则 ”和 “其 他 ”措施 所 能 预防 的 故障 通 肖 
需要 较 少 天 数 来 解决 ， 而 “更 正规 的 需求 、 需求 /设计 模板 ”和 “专业 人 士 / 文 档 ” 措 施 所 能 预 
防 的 故障 需要 比 预 期 更 长 的 时 间 来 解决 。 

在 表 25-15 中 ， 我 们 用 交叉 表格 展示 了 故障 及 预防 措施 的 关系。 和 上 次 一 样 ， 横 排 的 征 故 障 
(表格 左 侧 ) ， 纵 列 的 是 预防 措施 《表格 上 方 数字 )。 表 格 的 各 项 所 代表 的 意思 和 前 一 个 展示 故障 
BERG ANI AS LRR. 

KTHEN, RIRA EE WL Ps Me EE Eh. 程序 演练 ”被 认为 是 能 最 有 
效 地 预防 这 些 常 见 故 障 的 措施 。 此 外 ,“ 专 业 人 士 / 文 档 ”,“ 更 正规 的 需求 ”和 “更 正规 的 接口 规 
格 文档 ”也 是 预防 这 些 常 见 故障 的 重要 措施 。 

e O00000 SU 

“程序 演练 ”( 预 防 措 施 5) 被 视 作 是 预防 这 个 类 型 故障 最 有 效 的 措施 ， 可 以 预防 27% 的 

内 部 功能 类 故障 。 专业 人 士 /文档 ” (预防 措施 6) 被 视 作 是 第 二 有 效 的 措施 ,可 以 预防 18%。 

“需求 /设计 模板 ”被 视 作 可 以 预防 14% 的 此 类 故障 ， 比 预计 的 稍 高 1 个 百分点 。 

表 25-15 故障 及 预防 措施 














1 2 3 4 5 6 7 8 9 10 
8.8% 10.0% 7.2% 2.2% 24.5% 15.7% 15% 13.3% 99% 6.9% 
1. 语言 陷阱 3.5% 0 0.1 0.1 0 1.0 0.3 0.1 1.3 0.4 0.2 
2. 协议 0.4% 0.1 0.2 0 0 0.1 0 0 0 0 0 
3. 底层 逻辑 7.9% 0.1 0 0.1 0.2 23 0.3 0.2 3.2 0.8 0.7 
4. CMS 复杂 度 0.3% 0 0 0 0 0 0.1 0 0.1 0.1 0 
5. 内 部 功能 25.0% 1.9 AS 1.5 0.4 6.6 4.4 0.2 33 3.1 0.1 


6. 外 部 功能 3.6% 0.6 0.3 0.4 0 0.1 0.7 0 0.5 0.9 0.1 





356 ”第 25 章 软件 的 缺陷 都 从 哪儿 来 


(2%) 
1 2 3 4 5 6 7 8 9 10 
8.8% 10.0% 7.2% 2.2% 245% 15.7% 15% 13.3% 9.9% 6.9% 
7. 原始 数据 类 型 2.4% 0.1 0.1 0.2 0 0.8 0.3 0 0.1 0.2 0.6 
误 用 
8. 原始 数据 类 型 0.6% 0.1 0 0 0 0.3 0 0 0 0.1 0.1 
不 支持 
9. 变更 协调 4.9% 0.4 0.9 0.3 0.4 0.8 0.3 0.3 0.3 0.7 0.5 
10. 接口 复杂 度 11.4% 2.1 0.3 2.1 0 3.0 1.7 0.1 1.0 0.7 0.2 
11. 设计 /代码 复 7.7% 0.8 0.5 0.1 0.4 22 2.4 0.2 0.3 0.4 0.4 
AR JE 

12. 错误 处 理 3.3% 0.2 0.2 0.3 0.1 0.6 0.6 0 0.4 0.5 0.4 
13. 争 用 情况 4.3% 0.8 0 0.4 0 19 0.4 0.2 0.4 0.2 0.7 
14. PERE 0.9% 0 0 0 0.2 0.2 0.3 0 0 0 0.2 
15. 资源 分 配 15% 0.1 0.1 0.1 0 0.3 0.3 0 0.3 0.3 0 
16. 动态 数据 设计 0.3% 0 0 0 0 0.1 0 0 0.1 0 0.1 
17. 动态 数据 使 用 2.1% 0 0 0.2 0 0.8 0.5 0 0.5 0 0.1 
18. 静态 数据 设计 1.0% 0.1 0.1 0 0 0.2 0.2 0 0 0.3 0.1 
19. 未 知 的 互动 0.7% 0.1 0 0.2 0 0 0.2 0 0 0.2 0 
20. 意外 的 依赖 性 ”8.0% 0.6 22 1.1 0.1 2.3 0.6 0 0.4 0.6 0.1 
21. 并 行 的 工作 4.4% 04 0.7 0 0.2 19 1.1 0.1 0.3 0 0.4 
22. 其 他 S.8% 0.3 0.8 0.1 0.2 0.4 1.0 0.1 0.6 0.4 1.9 


Pi 


*HUUUUUUY 100 

同样 的 ，“ 程 序 演练 ”被 视 作 是 最 有 用 的 预防 措施 ， 可 以 预防 26% 的 该 类 故障 。" 更 正规 
的 需求 ”( 预 防 措 施 1) 和 “更 正规 的 接口 规格 文档 ”被 认为 是 同样 有 效 的 措施 ， 都 可 以 预防 
18% 的 该 类 故障 ， 这 两 者 的 比率 都 比 预 期 高 一 个 百分点 。 
e 00000000L 20L 

“程序 演练 ”被 视 作 是 最 有 用 的 预防 措施 ， 可 以 预防 29% 的 该 类 故障 。' 需求 /设计 模板 
被 认为 是 第 二 有 用 的 措施 ， 可 以 预防 28% 的 该 类 故障 〈 比 预计 的 高 1 个 百分点 )。 “更 正式 的 
接口 规格 文档 ”被 认为 可 以 预防 14% 的 该 类 故障 ， 比 预计 的 高 1 个 百分点 。 
*HUUUUUUUUU!ILY 

“专业 人 士 /文档 ”被 视 作 是 最 有 效 的 预防 措施 , 可 以 预防 31% 的 该 类 故障 〈( 比 预期 要 高 )。 
“程序 演练 ”被 认为 是 第 二 有 效 的 措施 ， 可 以 预防 29% 的 该 类 故障 。" 更 正规 的 需求 ”是 第 三 
有 效 的 措施 ， 可 预防 10% 的 此 类 故障 。 
跟 之 前 一 样 ， 为 了 简洁 起 见 ， 我 们 只 旁 虚 最 常见 的 预防 措施 以 及 这 些 措 施 可 以 预防 的 政 
不 出 所 料 ， 最 容易 被 这 些 第 见 预防 措施 预防 的 故障 是 “内 部 功能 ”和 “接口 复 淋 度 ” 











这 
两 类 最 普遍 的 故障 。 不 过 让 人 费解 的 是 ， 最 容易 被 这 些 预 防 措 施 预 防 的 故障 还 包括 “低层 多 


辑 类 故障 。 
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e 0000000050 

这 个 措施 预防 最 多 的 是 “内 部 功能 ”( 故 障 $) ， 占 该 措施 预防 故障 总 数 的 27%。“ 接 口 复 
杂 度 ”( 故 障 10) 第 二 ， 占 12%。 “低层 逻辑 ”( 故 障 3) 和 “意外 的 依赖 性 ”( 故 障 20) 第 三 ， 
各 占 9%。 
° NOOO GO00000 4 

和 前 一 条 一 样 ， 这 个 措施 预防 最 多 的 是 “内 部 功能 ”， 占 预防 总 数 的 29%。 “设计 /代码 复 
杂 度 ”第 二 ,， 占 19%， 比 预计 的 要 高 1 个 百分点 。 “接口 复 杂 度 ”第 三 ， 占 11%， 比 预计 要 高 。 
° Eeee a 

个 措施 预防 最 多 的 两 个 故障 是 “内 部 功能 ”和 “底层 逻辑 ”， 分 别 占 预防 总 数 的 25% 

ee Ona tine). “iS babe” (chal) =, ioe, 比 预 期 要 高 。 "接口 复杂 度 ” 
第 四 ， 占 预防 总 数 的 9%。 


6. 深层 诱因 和 预防 措施 

在 表 25-16 中 ， 可 以 留意 到 一 个 有 意思 的 现象 ， 那 就 是 卡 方 分 析 的 结果 显示 了 很 大 的 偏差 ， 
即 对 比 深 层 诱 因 和 预防 措施 的 关系 数据 的 预期 值 和 实际 值 的 差别 变 大 了 。 这 意味 着 故障 的 深 层 诱 
因 和 其 预防 措施 之 间 有 着 强烈 的 关联 。 这 和 我 们 的 第 识 一 致 。 


表 25-16 预防 措施 及 深层 诱因 
1 2 3 4 5 6 7 8 9 10 








20.5% 54% 20% 25.2% 98% 73% 17.8% 11% 68% 4.1% 








1. 更 正规 的 需求 8.8% 0.4 2.3 0.9 3.5 0.8 0.3 0.5 0.1 0 0 
2. 需求 /设计 模板 10.0% 0.4 1.7 0.1 3.7 1.9 0.1 0.8 0 1.3 0 
3. 更 正规 的 接口 规 7.2% 08 0.3 0.1 27 0.8 0.3 2.0 0 0.2 0 
格 文档 
4. 培训 2.2% 0.4 0 0.1 0.7 0.1 0.3 0.6 0 0 0 
5. 程序 演练 24.5% 7.5 0.2 0.3 7.3 3.1 1.8 3.1 0 0.5 0.7 
6. 专业 人 士 / 文 档 15.7% 1.5 0.4 0.4 3.5 1.8 1.0 5.8 0.6 0.3 0.4 
7. 设计 /代码 同步 15% 0.4 0 0 0.6 0.2 0.1 0.2 0 0 0 
8. 严格 执行 准则 13.3% 4.0 0.1 0 0.6 0.2 1.6 2.5 0 3.7 0.6 
9. 更 好 的 测试 安排 “9.9% 2.8 0.2 0 i7 0.8 1.6 1.9 0.3 0.2 0.4 
10. 其 他 6.9% 2.3 0.2 0.1 0.9 0.1 0.2 0.4 0.1 0.6 2.0 


我 们 首先 总 结 一 下 最 主要 有 的 深层 诱因 和 它们 相对 的 预防 措施 。 最 主要 的 预防 措施 分 别 古 “ 程 
PRR”. 专业 人 士 文 档 ” 和 “严格 执行 准则 ”。 
*HUUUUUUUUU0O 4 
由 此 类 原因 引起 的 故障 有 28% 被 认为 可 以 用 “程序 演练 (hes) 来 预防 ， 比 预期 高 1 
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个 百分点 ， 是 最 主要 的 措施 。 并 列 排 在 第 二 的 是 “需求 /设计 模板 ”( 措 施 2) 和 “专业 人 士 / 
文档 ”( 措 施 6) , 均 被 认为 可 预防 14% 的 此 类 原因 引起 的 故障 , 前 者 比 预 期 高 1 个 百分点 。 “更 
正规 的 需求 ”( 措 施 1) 第 三 ， 可 预防 12% 的 故障 ， 比 预期 高 1 个 百分点 。 

e 0000010 

同上 ,“ 程 序 演 练 ”是 最 主要 的 措施 ， 被 视 作 可 以 预防 37% 的 此 类 故障 。 接 下 来 的 三 个 

措施 分 别 是 “严格 执行 准则 ” (措施 8)、“ 更 好 的 测试 安排 ”( 措 施 9) 和 “其 他 ”( 措 施 10)， 

分 别 被 视 作 可 预防 19%、14% 和 10% 的 此 类 故障 。 对 于 所 有 的 这 些 措 施 ， 实 际 观 察 到 的 值 都 

比 预期 的 要 高 。 

e 000000070 

“FAAEE” RAAST LAF 3.2% FIX AL 5 eE, LEU SR, 是 

对 应 此 项 的 最 主要 的 预防 措施 。 “RAR” SPT EMU” F E ERA FY” 

分 别 被 认为 可 以 预防 17%、14% 及 11% 的 此 类 故障 。 "程序 演练 ”的 比率 比 预期 低 一 些 , 而 “更 

正规 的 接口 规格 文档 ” 比 预 期 要 高 一 些 。 

接 下 来 我 们 反 过 来 ,总 结 一 下 主要 的 预防 措施 ， 以 及 他 们 对 应 的 故障 诱因 。 这 些 预防 措施 预 
防 最 多 的 诱因 分 别 是 “认识 不 足 ”、“ 未 给 出 ”和 “模棱两可 的 设计 ”。 有 一 点 令 人 不 解 的 是 , “未 
给 出 ”竟然 被 视 作 这 些 预 防 措施 能 预防 的 主要 诱因 之 一 。 

e 000000050 

“未 给 出 ”( 原 因 1) m PeR ORRA 被 认为 是 这 个 措施 主要 预防 的 诱 

Al, 分 别 占 总 数 的 31% 和 30%,， 比 预期 要 高 。 模棱两可 的 设计 ”( 原 因 5) 和 “认识 不 足 ”( 原 

因 7) 并 列 第 二 ， 分 别 占 13%， 前 者 比 预期 高 ， 后 者 比 预期 低 。 

e 000000000 60 

“认识 不 足 ” 被 看 做 是 这 个 措施 预防 得 最 多 的 故障 诱因 ， 占 总 数 的 37%， 比 预期 要 高 1 个 

百分点 。 “不 完整 /遗漏 的 设计 ”和 “模棱两可 的 设计 ”被 认为 是 第 二 和 第 三 ， 分 别 占 23% 和 

11%。“ 未 给 出 ”是 第 四 ， 占 10%， 比 预期 要 低 。 

e 0000000080 

“未 给 出 ”和 “错误 的 修改 ”被 认为 是 这 个 措施 预防 最 多 的 两 个 故障 诱因 ， 分 别 占 30% 

和 28%, 均 高 出 预期 水 平 。“ 认 识 不 足 ” 和 “ 早 前 修复 不 当 ” 占 第 三 和 第 四 ,分 别 占 19% 和 12%， 

后 者 比 预 期 要 高 。 


25.4.3 ”界面 故障 与 实现 故障 


对 于 什么 是 界面 故障 ， 我 们 这 里 采取 Basili 和 Perricone”! A W Perry 和 Evangelist HP 的 定 
义 ， 即 : 界面 故障 是 指 “ 处 在 模块 之 外 ， 但 又 被 模块 所 使 用 的 组 织 结构 的 相关 故障 ”。 从 这 个 定 
义 来 看 ， 我 们 大 概 可 以 将 “语言 陷阱 ”(1),“ 底 层 逻 辑 ”(3),“ 内 部 功能 性 ”(5),“ 设 计 / 代 码 
复杂 性 ”(11),“ 性 能 ”(14) 和 “其 他 ”(22) 作为 实现 故障 ， 而 剩余 的 则 是 界面 故障 。 刚 刚 说 
这 样 的 分 类 是 “大 概 ”的 原因 是 ， 有 一 些 实 现 类 的 故障 有 可 能 也 包含 着 界面 的 问题 。 例 如 之 前 我 
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们 看 到 有 些 “ 设 计 / 代 码 复杂 性 的 故障 被 认为 可 以 由 “更 正规 的 接口 规格 文档 来 解决 。 表 25-17 
列 出 了 两 种 故障 的 对 比 。 


表 25-17 ”接口 /实现 故障 对 比 


接口 故障 实现 故障 
频率 49% 51% 
用 检测 难度 加 权 后 50% 50% 
用 修复 难度 加 权 后 56% 44% 


虽然 比 起 实现 故障 ,接口 故障 的 频率 要 小 一 些 , 但 是 两 种 故障 却 和 需要 同样 的 时 间 来 检测 ， 
且 接 口 故障 比 实现 故障 需要 更 多 的 时 间 来 修复 。 

表 25-18 对 两 种 故障 以 及 各 自 的 深层 诱因 进行 了 对 比 。“ 其 他 ”、“ 模 楼 两 可 的 需求 “未 给 
出 *“、“ 时 前 修复 不 当 ” 和 “模棱两可 的 设计 ”更 偏 各 于 造成 更 多 的 实现 故障 。 而 “不 完整 的 / 进 
漏 的 需求 ”、“ 错 误 的 修改 ”和 “被 过 提交 ”较为 倾 回 于 造成 更 多 接口 故障 。 

需要 注意 的 是 ， 从 表 中 的 数据 来 看 ， 那 些 和 模棱两可 、 暖 昧 不 请 相关 的 诱因 通 销 引发 更 多 的 
实现 故障 ， 而 那些 和 不 完整 性 、 遗 漏 和 琉 忽 相关 的 诱因 通常 引发 更 多 的 接口 故障 。 


表 25-18 ”接口 /实现 故障 和 深层 诱因 


接口 故障 实现 故障 

49% 51% 
l 未 给 出 45.2% 54.8% 
2 不 完整 /遗漏 的 需求 79.6% 20.4% 
3 模棱两可 的 需求 44.5% 55.5% 
4 不 完整 /遗漏 的 设计 50.8% 49.2% 
5 模棱两可 的 设计 47.0% 53.0% 
6 早 前 的 修复 不 当 45.1% 54.9% 
7 认识 不 足 49.2% 50.8% 
8 PIRATE Bc 54.5% 45.5% 
9 被 过 提交 63.1% 36.9% 
10 其 他 39.1% 60.1% 


表 25-19 对 比 了 接口 和 实现 故障 及 对 应 的 预防 措施 。 不 出 意料 ， 比 起 预防 实现 故障 ， 措 施 1 和 
措施 3 能 预防 更 多 的 接口 故障 。 措 施 &8， 措 施 4 和 措施 6 被 认为 更 能 预防 实现 类 的 故障 。 


表 25-19 ”接口 /实现 故障 和 预防 措施 


接口 故障 实现 故障 
49% 51% 
1 更 正规 的 需求 64.8% 35.2% 
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( 续 ) 
接口 故障 实现 故障 
49% 51% 
2 需求 /设计 模板 51.5% 48.5% 
3 更 正规 的 接口 规格 文档 73.6% 26.4% 
4 培训 36.4% 63.6% 
5 程序 演练 48.0% 52.0% 
6 专业 人 士 /文档 44.3% 55.7% 
7 设计 /代码 同步 46.7% 53.3% 
8 严格 执行 准则 33.1% 66.9% 
9 更 好 的 测试 计划 48.0% 52.0% 
10 其 他 49.3% 50.7% 


25.5 ”研究 结果 可 靠 吗 


做 实证 研究 就 和 做 软件 系统 一 样 ,我们 不 可 能 创造 出 一 个 完美 的 系统 ,而且 常 弟 都 会 犯错 误 ， 
做 出 存在 各 式 各 样 问题 和 缺点 的 系统 。 不 过 无 论 古 做 研究 还 是 做 软件 ,最 重要 的 关键 部 是 同一 个 ， 
那 就 是 : 这 些 缺 点 和 琉 写 是 否 会 影 啊 到 研究 或 者 软件 系统 的 有 效 性 ? 

要 确定 我 们 研究 的 优 劣 以 及 研究 结果 是 否 有 效 ， 我 们 需要 回答 下 面 三 个 问题 (1) 我 们 调 
查 的 对 象 是 否 正确 ; (2) 对 于 我 们 观察 到 的 结果 ， 有 没有 别 的 解释 ( 即 我 们 的 方法 古 否 正确 ); 
(3) 我 们 的 研究 结果 的 意义 何在 ( 即 我 们 能 用 这 些 结 来 来 做 什么 )。 


25.5.1 我 们 调查 的 对 象 是 否 正确 


我 们 有 非 第 充分 的 理由 相信 我 们 的 研究 能 帮助 人 们 理解 软件 开发 中 出 现 的 故障 及 其 市 来 的 
后 朱 。 在 研究 中 我 们 解答 了 这 样 一 些 基 本 的 问题 : 出 现 的 故障 ， 其 检测 的 难度 ,修复 的 难度 ， 产 
生 的 深层 原因 以 及 如 何 来 预防 、 检 测 、 改 善 这 些 克 障 。 此 外 ,我 们 还 回 人 党 了 早 前 在 接口 故障 人 研究 
中 提出 的 一 个 疑问 : 接口 故障 和 实现 故障 ， 哪 个 更 难 检测 /修复 ? 卡 方 分 析 显 示 故 障 及 其 深层 放 
因 和 预防 措施 之 间 有 着 很 强 的 关联 性 , 而 前 后 一 致 并 相互 呼应 的 分 析 结 采 成 为 了 我 们 的 答案 的 强 
力 文 持 。 这 种 强烈 的 关联 性 也 意味 着 我 们 的 各 个 调查 结 来 是 一 致 的 。 

但 征 ， 这 份 研究 仍然 存在 着 缺陷 。 首 先 ， 故 隐 的 分 类 并 不 仔细 。 其 次 ， 故 隐 检 测 和 故障 修复 
的 难度 测量 方法 并 不 统一 ， 故 障 修 复 难 度 的 测量 方法 要 比 检 测 难度 的 方法 好 得 多 。 最 后 ,没有 请 
苇 地 区 分 接口 故障 和 实现 故障 。 

这 样 的 故障 分 类 的 主要 优点 是 : 它 是 由 开发 人 员 (MIERA R) 自己 定义 的 。 缺点 就 是 分 
类 不 仔细 而 且 太 长 了 。 在 实际 参与 调查 的 过 程 中 , 被 调查 者 很 有 可 能 没有 耐心 看 完整 个 列表 来 选 
择 最 符合 的 类 别 ， 而 是 匆匆 选择 比较 接近 的 徘 前 的 类 别 。 

在 后 续 进 行 的 研究 “中 ， 我 们 解决 了 故障 分 类 的 问题 。 方 法 是 将 故障 分 为 三 大 类 ， 分别 
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是 实现 、 接 口 和 外 部 故障 (这样 也 同时 解决 了 上 面 说 的 第 三 条 缺陷 )， 而 在 这 些 大 类 之 下 又 有 6 
到 8 个 小 类 〈 见 参考 文献 [14] 的 117 页 )。 

同样 的 , 检测 和 修复 故障 的 难度 测量 方法 也 是 由 开发 人 员 决 定 , 但 是 后 琳 就 不 古 分 类 不 仔细 
那么 简单 了 。 测量 修复 故障 的 难度 很 镜 单 ， 只 需要 记 住 到 底 这 个 故障 花 了 多 少时 间 即 可 ,如 1 天 ， 
1 周 或 者 1 个 月 , 不 容易 搞 错 。 而 对 于 检测 故障 的 难度 ， 就 不 同 了 。 由 于 涉及 很 多 主观 的 因素 以 及 
人 与 人 之 间 的 差异 (基于 管理 上 的 限制 我 们 无 法 确定 这 种 差异 性 )， 检 测 故 障 的 难度 很 难 量化 。 
我 们 推荐 的 做 法 是 用 统一 的 可 以 量化 的 指标 (例如 时 间 ) 来 衡量 检测 和 修复 的 难度 。 当 然 我 们 在 
后 续 的 研究 “中 正 是 这 样 做 的 。 

接口 和 实现 故障 我 们 区 分 得 并 不 是 特别 清楚 ， 有 的 接口 故障 中 包含 了 一 些 实现 的 成 分 , 反之 
亦 然 ， 所 以 在 这 份 研 究 中 我 们 也 仅仅 是 大 概 区 分 了 一 下 。 如 前 面 所 言 ， 我 们 在 后 续 研 究 ”中 
分 了 三 大 类 (实现 、 接 口 、 外 部 ， 并 以 此 解决 了 这 个 问题 。 


25.5.2 ”我 们 的 方法 是 否 正确 


在 我 们 进行 的 两 个 步 又 中 ， 共 收回 了 68% 的 问卷 一 一 也 即 古 说 ， 我 们 的 数据 涉及 了 大 概 2/3 
的 故障 。 鉴 于 进行 调查 的 环境 比较 可 刻 ， 这 样 的 回复 率 已 经 大 大 超出 了 我 们 的 预期 。 诚然 ， 数据 
量 也 是 数据 古人 否 可 靠 的 一 个 重要 指标 。 

虽然 我 们 没 能 给 出 最 详尽 的 数据 , 但 古 我 们 已 经 尽力 在 对 于 调查 结 琳 的 讨论 中 做 到 精确 。 为 
了 理解 方便 ， 我 们 只 精确 到 了 小 数 点 后 一 位 数 ， 事 实 上 ,我 们 所 掌握 的 数据 量 已 经 大 到 可 以 精确 
到 小 数 点 后 两 位 数 。 

和 所 有 的 调查 研究 一 样 , 我 们 很 难说 那些 没有 收回 的 问卷 和 没有 参与 调查 的 人 能 在 多 大 程度 

影 啊 我 们 的 调查 结 末 。 季 运 的 是 ,我 们 了 解 到 ,在 调查 过 程 中 ， 并 没有 出 现 已 知 的 会 影 啊 调查 
结果 的 因素 ， 如 只 反馈 简单 的 或 者 困难 的 故障 ,或 者 只 有 初级 或 者 高 级 的 程序 员 参 与 调查 等 。 

我 们 还 提 到 了 关于 调查 的 重要 条 件 限 制 : 第 一 ， 调 查 绝对 不 能 打扰 正 第 工作 ; 第 二 ， 调 查 必 
须 是 完全 日 愿 参加 的 ; B=, 调查 必须 古 完 全 匿名 的 。 由 于 这 些 管 理 层 的 要 求 ， 我 们 无 法 验证 调 
查 结果 的 真实 性 “和 准确 性 。 不 过 , 有 两 个 事情 可 以 减轻 无 法 验证 调查 结果 所 带 来 的 影响 : 第 一 ， 
问卷 是 由 作者 和 一 组 开发 人 员 一 起 设计 的 ; 第 二 , 问卷 经 过 了 男 一 组 开发 人 员 的 独立 评 佑 。 在 调 
查 后 做 验证 古 为 了 确保 被 调查 者 对 于 问卷 问题 的 正确 解读 , 但 我 们 相信 , 我 们 在 调查 前 所 做 的 工 
作 也 能 达到 同样 的 效 末 ， 因 为 : 第 一 ， 我们 让 开发 人 员 参 与 到 问卷 的 制作 中 来 ,确保 问卷 古 用 他 
们 熟知 的 术语 写成 的 ; 第 二 , 我 们 在 正 却 开始 调查 之 前 对 一 小 组 开发 人 员 进 行 了 测试 调查 ， 而 在 
测试 调查 中 ， 我 们 没有 发 现任 何 错误 解读 问卷 的 情况 。 

剩 下 的 问题 ， 就 是 时 间 间 隔 过 长 了 。 从 故障 解决 到 项 写 问 卷 , 中间 的 时 间 最 长 达到 了 整整 一 
年 。 在 这 个 过 程 中 ,相关 的 信息 有 可 能 会 有 所 丢失 和 址 饼 。 不 过 ,让 主导 解决 这 个 故障 的 人 做 调 
查 ， 还 古 比 完全 不 了 解 这 个 故障 的 人 好 得 多 。 要 想 解决 时 间 推 移 的 问题 就 必须 “ 乘 热 打铁 "， 把 
故障 调查 作为 解决 故障 的 标准 流程 的 一 部 分 。 

还 有 一 个 需要 注意 的 古 :我 们 只 取 了 测试 阶段 的 故障 数据 ,这 可 能 对 总 体 调查 结 采 有 所 影 啊 。 
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如 采 我 们 能 收集 到 从 需求 分 析 阶 段 到 系统 发 布 时 的 所 有 故障 , 就 能 得 到 一 个 更 为 全 面 和 准确 的 结 
AL 但 是 , 我 们 也 注意 到 ,这 种 从 缠 试 阶段 开始 才 记 录 故 障 信 息 的 方式 对 于 大 部 分 软件 开发 流程 
来 说 几乎 可 以 说 是 一 种 标准 ， 所 以 这 个 问题 可 以 忽略 。 

总 的 来 说 ,我们 相信 这 些 调查 研究 设计 上 的 问题 ， 相 比 起 支持 我 们 论点 的 证 据 而 言 ， 征 微 不 
足 道 的 。 这 也 意味 着 ， 我 们 的 数据 是 有 效 的 ， 调 查 结 琳 并 未 受 其 他 因素 的 影响。 


25.5.3 ”我 们 能 用 这 些 结果 做 什么 


所 有 软件 行业 的 实证 研究 都 需要 回答 的 一 个 主要 问题 是 :“ 对 于 我 这 样 的 一 个 开发 人 员 来 
说 ， 这 些 结 采 意味 着 什么 ”这 个 问题 的 答案 部 分 取决 于 研究 是 人 否 具 有 足够 的 代表 性 ， 这 个 同 题 
可 以 从 两 个 角度 来 回答 。 

第 一 个 角度 是 , 到 撒 我 们 所 研究 的 这 个 发 行 版 本 在 多 大 程度 上 可 以 代表 这 个 系统 所 有 发 行 挨 
本 的 情况 。 如 采 这 个 发 行 版 本 不 具备 代表 性 , 那么 基于 这 个 发 行 版 本 的 研究 结 东 也 不 一 定 具备 代 
表 性 。 在 这 个 研究 中 ,我 们 认为 所 选 定 的 发 行 版 本 具备 代表 性 ， 因 为 结 来 中 故障 修复 、 新 功能 和 
改 民 的 比例 和 之 前 的 版 本 一 致 。 在 我 们 调查 这 个 发 行 版 本 之 后 的 几 个 版 本 中 ,故障 修复 的 比例 有 
MEF, 不 过 ， 在 这 几 个 版 本 之 后 ， 整 个 比例 又 恢复 到 了 之 前 的 状态 。 

在 确定 版 本 代表 性 的 问题 之 后 , 我 们 需要 确定 所 研究 的 软件 系统 能 在 多 大 程度 上 代表 其 他 的 
软件 系统 。 对 于 这 个 问题 ， 可 以 确定 的 是 ,我 们 选择 的 这 个 系统 可 以 代表 具有 与 其 同样 特征 ， 如 
大 规模 、 高 度 容错 、 极 高 稳定 度 、 实 时 性 ， 并 在 Unix 环 境 下 使 用 笛 用 编程 语言 《如 C) 来 开发 的 
这 一 小 类 系统 。 在 这 样 的 系统 中 存在 着 类 似 的 问题 。 

那么 这 个 系统 的 开发 和 其 他 软件 系统 的 开发 有 多 少 征 相通 的 呢 ? 我们 认为 非 第 相通 。 在 最 主 
要 的 五 种 故障 中 ， 我 们 并 未 发 现任 何 证 据 表 明 这 些 主 要 的 故障 仪 存 在 于 这 一 类 系统 中 。 实 际 上 ， 
整个 故 隐 的 分 布 情况 和 我 们 在 各 种 规模 或 者 类 型 的 软件 开发 中 所 过 到 的 大 同 小 异 。 我 们 对 预防 措 
施 也 有 相同 的 结论 。 而 主要 的 区 别 在 于 不 同 的 系统 会 有 不 同 的 故障 的 频率 、 诱 因 和 预防 措施 。 

我 们 采用 的 研究 方式 坚 无 疑问 是 具有 普 壳 性 的 ， 适 用 于 对 各 种 规模 和 类 型 软件 开发 的 研究 。 
如 琳 在 其 他 系统 中 也 能 发 现 同样 第 见 的 故障 ， 那 就 意味 着 我 们 的 研究 结 末 也 适用 于 这 些 系 统 。 对 
于 这 一 点 ， 我 们 数据 前 后 的 一 致 性 和 数据 间 的 相互 呼应 可 以 作为 证 明 。 


25.6 ”我 们 明白 了 什么 


研究 的 结论 总 结 如 下 。 

O 需求 、 设 计 和 代码 编写 相关 的 故障 占 忌 数 的 34%。 需 求 故障 大 概 占 5%。 这 些 故 障 虽然 数 
量 并 不 是 特别 大 ， 但 却 非 常 重 要， 因为 其 发 现 的 时 间 点 通常 非常 菲 后 ， 在 发 现 了 以 后 ， 
修复 故障 的 成 本 已 经 非 弟 高 

O 测试 大 规模 的 、 复 杂 的 实时 系统 的 实验 环境 本 身 又 生 吃 外 一 个 大 规模 的 复杂 的 实时 系统 。 
在 我 们 研究 的 这 个 发 行 版 本 的 开发 中 ,测试 相关 的 故障 占 了 总 数 的 四 分 之 一 。 

O 故障 中 有 16% 古 “ 非 故 障 ， 再 加 上 很 多 “未 知 的 依赖 性 和 “接口 或 设计 /代码 复杂 度 、 
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这 样 的 故障 ， 都 表明 了 对 系统 的 认识 不 足 是 这 个 版 本 开发 过 程 中 的 一 个 大 问题 。 

O 设计 和 代码 编写 相关 的 故障 中 ， 有 78% 需 要 5 天 或 者 更 少 的 时 间 解 决 ， 有 22% 需 要 6 天 或 者 
更 多 的 时 间 来 解决 。 我 们 注意 到 在 修复 这 些 故障 时 涉及 一 些 额外 开销 ， 包 括 如 何 达成 一 
致 的 解决 方 染 、 创 建 需 要 的 系统 组 件 以 及 用 测试 环境 来 验证 修复 古人 否 正 确 等 。 不 过 可 惜 
的 是 ， 我 们 并 没有 关于 这 些 额 外 开销 的 数据 。 

O 数量 最 多 的 前 5 个 故障 类 型 占 到 了 总 数 的 60%。 它 们 分 别 是 : 内 部 功能 、 接 口 复 杂 度 、 未 
知 的 依赖 性 、 抵 层 迎 辑 和 设计 /代码 复杂 度 。 除 了 “底层 迎 辑 ”以 外 ， 甚 余 几 个 都 是 我 们 
预感 在 这 样 一 个 大 型 而 复杂 的 实时 系统 中 频 营 出 现 的 问题 。 

O 为 故障 加 上 了 检测 和 修复 时 间 权 重 之 后 ， 结 来 正好 和 我 们 对 于 各 个 故障 的 检测 和 修复 难 
度 的 感觉 一 致 。 

O 设计 和 代码 相关 的 故障 的 深层 诱因 中 ， 不 冤 整 /遗漏 的 设计 ， 认识 不 足 ”和 “未 给 出 
(我 们 认为 “未 给 出 ”意味 着 有 时 候 并 没有 更 次 层 的 诱发 原因 ) 占 到 了 64%。 这 些 诱因 的 
故障 修复 权重 和 我 们 的 感觉 正好 一 致 ， 由 需求 引发 的 故障 最 难 修复 ， 而 由 模 楼 两 可 的 设 
计 和 认识 不 足 引 发 的 故障 最 容 多 修复 。 

口 “ 程 序 演练 ， 专业 人 士 /文档 ， 严格 执行 准则 ”和 “需求 /设计 模板 ”被 认为 可 以 预防 
64% 的 设计 和 代码 相关 故障 。 我 们 认为 ，“ 程 序 演练 ”高 达 25% 的 比例 可 以 证 明 Curtis， 
Krasner 和 Iscoe 的 看 法 ”， 即 对 于 程序 的 认识 不 足 是 一 个 重要 的 问题 。 

口 虽然 人 们 更 倾 问 于 非 正 去 的 预防 措施 ， 但 是 非 正 式 的 预防 措施 所 预防 的 故障 都 笛 冲 比较 
容易 解决 ， 而 正式 的 预防 措施 所 预防 的 故障 一 般 更 难 解决 。 

O 在 Perry 和 Evangelist 的 两 篇 论文 “" 中， 接口 故 障 被 认为 占 了 全 部 故障 的 大 部 分 (68%)。 
但 是 ， 研 究 中 接口 故障 和 实现 故障 并 没有 加 权 比 较 。 在 我 们 的 研究 中 发 现 ， 接 口 故 障 大 
概 占 总 数 的 49%，, 但 他 们 要 比 实现 故障 要 更 难 解决 (参见 前 面 的 讨论 )。 不 出 所 料 ，" 更 正 
规 的 需求 和 “更 正规 的 接口 规格 文档 ”被 看 作 两 个 重要 的 预防 接口 故障 的 措施 。 

由 于 所 研究 的 这 个 系统 的 开发 使 用 了 当前 的 “最 佳 实践 ”所 推 深 的 技巧 和 工具 ,开发 人 员 也 
ABET BREA, ALA, 我们 觉得 这 里 得 出 的 数据 也 可 以 适用 于 其 他 的 大 型 实时 系统 。 有 和 鉴于 此 ,我 
们 也 在 这 里 对 改进 当前 的 “最 住 实践 ”提出 如 下 一 些 建 议 。 

D 在 所 有 开发 环 市 中 收集 故障 数据 (而 不 古 只 在 测试 的 环 市 中 收集 )， 并 用 这 些 数据 监测 整 

个 开发 进度 。 

口 将 故障 调查 作为 故障 修复 的 一 个 必需 步骤 来 进行 ， 乘 热 打 铁 地 在 开发 人 员 疝 未 乓 记 故 障 
言 息 的 时 候 进行 调查 。 调 查 的 数据 会 提供 一 个 直观 的 方式 来 改进 流程 ， 以 解决 当前 最 频 
蒙 或 者 妈 难 检测 /解决 的 故障 。 

O 在 当前 的 流程 中 加 入 非 正式 的 、 需 要 大 家 参与 的 预防 措施 ， 如 “程序 滥 练 "、“ 专业 人 
十 /文档 和 “严格 执行 惟 则 ”等 。 我 们 的 研究 已 经 表明 ， 这 些 措施 对 大 部 分 故 隐 的 检测 
和 解决 都 有 好 处 。 

O 在 当前 的 流程 中 加 入 正式 的 工具 和 方法 ， 以 提高 需求 、 染 构 和 设计 文档 的 准确 度 和 完整 
度 。 这 些 可 以 对 那些 较 难 修复 的 故障 产生 作用 ， 也 可 以 帮助 我 们 在 开发 中 更 早 发 现 需 求 、 
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染 构 和 设计 上 问题 。 

作为 结尾 ,这 里 列 出 我 们 从 人 研究 中 所 学 到 经 验 和 教训 ,以 期 能 帮助 改进 以 后 的 软件 开发 流程 。 

口 如 采 币 望 用 减少 故障 的 方式 来 改进 产品 的 话 ， 节 快 的 办 法 束 是 雇 一 群 真正 了 解 这 个 产品 
AMA. WE, WURDE i ie ich ee ERE, SrtA te ee A 
充分 的 人 。 

口 改进 软件 开发 的 方法 中 ， 节 不 靠 谱 的 就 是 使 用 “更 好 ”的 编程 语言 。 我 们 的 研究 显示 ， 
可 以 用 使 用 更 好 的 编程 语言 解决 的 故障 相对 较 少 。 

O 在 改善 开发 环境 的 过 程 中 ， 我 们 应 该 尝试 更 多 地 使 用 各 种 工具 和 方法 来 帮助 人 们 了 解 系 
统 〈 及 修改 系统 会 带 来 的 后 条 ) 。 因 为 说 到 底 ， 这 些 提升 对 系统 认识 的 方法 很 可 能 是 故障 
预防 的 最 有 效 措 施 。 
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关于 软件 工程 的 教育 已 经 有 很 多 论述 了 : BT ACA TT LAY MAAS e, BP AS 
技能 ， 好 让 他 们 成 为 专业 的 软件 工程 师 。 但 是 ， 学 习 不 会 止步 于 毕业 。 实 际 上 ， 毕 业 仅 仅 古 新 的 
学 习 的 开始 。 新 进 公 司 的 工程 师 们 必须 学 习 在 截止 时 间 之 前 完成 代码 的 编辑 、 修 改 和 调试 ,也 需 
要 学 习 用 恰当 的 方式 与 大 型 团队 里 的 其 他 同事 们 交流 和 互动 。 在 这 一 半 中 , 我 们 将 详细 展示 急 入 
职场 的 软件 工程 师 的 经 历 ， 以 此 来 讨论 大 学 和 公司 两 种 学 习 过 程 的 共性 以 及 区 别 。 

大 学 教育 答 试 教 给 学 生 们 关于 电脑 技术 的 一 些 核心 概念 , 这 样 他 们 便 可 以 在 以 后 的 生活 中 目 
发 地 学 习 ， 并 跟 上 计算 机 科学 的 寡 六 。 新 的 编程 范式 《比如 面 癌 对 象 的 编程 ) 和 新 的 开发 方法 论 
(比如 敏捷 、 极 限 编程 等 ) 的 诞生 让 软件 行业 发 展 迅速 ,也 使 得 学 校 教育 必须 主要 关注 这 些 “ 硬 - 
技能 。 学 校 的 学 术 环 境 并 不 会 教 给 学 生 太 多 “ 软 技能 ,， 也 就 是 软 件 工程 中 和 “人 “有 关 的 部 分 ， 
比如 创建 和 调试 规格 文档 ， 为 代码 加 上 文档 以 前 述 其 原理 及 历史 ， 遵 循 软件 开发 方法 论 的 原则 ， 
管理 大 型 项 目 以 及 和 团队 中 的 其 他 成 员 合作 等 。 

那些 初 入 职场 的 毕业 生 们 需要 再 学 习 新 的 技术 、 技 巧 和 流程 ， 实际 上 又 变 回 了 一 个 初学 者 。 
他 们 也 许 会 惊讶 的 发 现 ， 原 来 在 他 们 刚刚 得 到 的 工作 中 ， 软 技能 才 是 最 主要 的 组 成 部 分 IPI) A 
要 成 为 有 用 之 才 ， 尤 其 是 在 大 型 独立 的 软件 开发 公司 中 的 软件 开发 人 才 ， 需 要 完整 的 软 硬 技能 。 
而 雇主 们 发 现 ， 刚 刚 大 学 纤 业 的 应 届 生 们 通常 不 具备 这 样 完整 的 技能 。 在 eWeek.com 上 刊登 的 一 
篇 文革 中， 多 个 氨 受 采访 的 业内 软件 开发 人 员 都 指出 ， 应 届 毕 业 生 们 缺乏 沟通 和 团队 合作 能 
而 且 对 于 复杂 的 开发 流程 、 旧 的 代码 、 截 止 期 限 以 及 用 有 限 资源 开发 这 些 工作 中 和 见 的 东西 这 无 
准备 “。 

Schein 认 为 ， 新 人 融入 公司 的 过 程 包含 三 个 方面 : 职务 、 层 级 和 社会 网 络 ” 。 

ae EE 

“职务 ”代表 一 个 职位 的 任务 以 及 技术 要 求 。 大 学 里 的 课程 教学 生 们 学 习 通 用 的 知识 ( 比 

如 编程 、 数 据 结构 、 软 件 工程 ) 和 专业 领域 知识 《比如 图 形 设 计 、 人 工 智能 、 操 作 系统 )， 
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这 些 课程 可 以 很 好 地 解决 这 个 问题 。 
。 OQ 
“层级 ”是 公司 从 上 至 下 的 指挥 体系 。 学 校 并 没有 很 多 涉及 这 个 方面 。 举 例 来 说 ， 虽 然 

在 很 多 的 课程 中 学 生 们 都 需要 组 成 小 组 并 进行 合作 , 但 是 小 组 中 每 个 人 的 权力 都 相同 ， 而 且 

往往 经 验 也 相同 ， 这 与 职场 新 人 需要 面 对 的 状况 非常 不 同 。 

e 0000 

“社会 网 络 ” 代 表 着 职场 新 人 逐渐 创造 新 的 人 肪 关系， 并 从 社会 网 络 的 边缘 癌 中 心 移动 

的 过 程 。 很 不 幸 ， 在 这 一 点 上 学 校 帮 不 上 什么 忙 ， 如 何 发 展 完 全 靠 学 生 们 自己 ,而 学 校 提供 

的 忠告 就 只 剩 下 不 要 作 交 或 者 不 准 相 互 帮忙 做 家 庭 作业 了 。 

由 于 学 校 教 学 的 局 限 性 ， 我 们 认为 很 多 学 生 在 毕业 时 并 没有 做 好 进入 软件 开发 行业 的 准备 。 
这 个 结论 来 自 于 对 在 微软 工作 的 8 位 高 校 应 届 毕 业 生 所 进行 的 研究 。 我 们 观察 了 这 些 新 开发 人 员 
在 进入 公司 头 半 年 的 两 个 月 中 日 常 工作 的 情况 。 在 分 析 了 这 些 新 晋 软件 开发 人 员 的 任务 、 活 动 、 
社交 和 产 出 的 数据 之 后 ， 我 们 发 现 ， 虽 然 新 的 开发 人 员 们 在 职责 和 技术 上 并 没有 问题 ， 但 是 对 于 
日 党 的 社交 和 沟通 ， 他 们 就 显得 缺乏 准备 和 培训 了 。 我 们 认为 ， 他 们 所 缺乏 的 这 些 东 西 加重 了 自 
身 的 压力 和 焦 虐 感 ， 并 影响 了 他 们 在 开始 的 几 个 月 中 的 表现 。 

对 于 职场 新 人 的 社会 化 研究 告诉 我 们 , 要 想 提 高 自己 的 创造 力 .工作 效率 和 对 工作 的 满意 度 ， 
掌握 职务 、 层 级 和 社会 网 络 非常 重要 。 如 果 对 新 人 的 培训 采取 新 的 教育 方法 ， 比 如 结对 编程 、 合 
理 的 边际 参与 (legitimate peripheral participation), iit xl, ABA AMA ALA A FS Hh ie 
这 三 个 方面 。 我 们 希望 这 一 草 中 对 于 软件 开发 新 手 的 详细 研究 可 以 帮助 人 们 更 好 地 讨论 和 评估 本 
科教 育 的 各 种 改良 方案 。 我 们 鼓励 读者 在 阅读 研究 数据 的 时 候 , 也 考虑 一 下 是 否 可 以 尝试 新 的 教 
育 方案 和 方法 。 


26.1 研究 方法 


我 们 进行 了 一 次 直接 观察 式 的 研究 并 用 扎根 理论 分 析 了 得 到 的 数据 。 直 接 观 察 意 味 着 有 一 
个 研究 人 员 将 和 被 观察 者 坐 在 同一 个 办 公 室 ， 留意 被 观察 者 的 一 从 一动 ， 并 记 杂 下 来 。 比 起 问卷 
调查 ， 我 们 通 汕 更 倾 同 于 直接 观 紧 。 因 为 作为 客观 的 观察 者 ， 我 们 可 以 做 到 不 偏 不 傈 ， 并 可 以 记 
东 下 每 一 个 细 市 ， 这 样 就 能 够 知道 发 生 的 各 种 事件 的 准确 信息 。 在 这 一 点 上 ， 直 接 观 察 和 采访 以 
及 问卷 调查 正好 相反 ,在 后 两 种 调查 方法 中 ， 参 与 调查 的 人 很 容易 受到 各 种 偏差 的 干扰 。 取 典型 
的 偶 差 来 源 于 对 细 贡 的 忽略 ,了 最 后 在 调 奋 中 就 只 是 给 出 了 一 些 范 统 的 日 前 工作 ,而 不 征 详细 地 去 
抽 述 每 一 个 具体 的 事情 。 此 外 还 有 记忆 偏 痉 ， 事情 一 旦 久远 ， 人 的 记忆 就 会 产生 偏差 。 在 我 们 这 
种 定性 研究 中 ， 节 终 目 标 并 不 是 消除 所 有 的 偏差 〈 这 也 不 可 能 做 到 ) ， 而 是 尽量 避免 会 对 我 们 的 
VIE i AN et BOAR I ht Zo 



































© grounded theory， 指 和 传统 的 “ 先 做 假设 再 证 明 ”不 同 的 ， 直 接 用 数据 来 得 出 结论 的 研究 方法 ，*“ 扎 根 ” 于 数据 的 
研究 理论 。 一 一 译 者 注 
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我 们 的 案例 研究 选择 使 用 少量 研究 对 象 进 行 直接 观察 。 研 究 对 象 的 选择 尽量 做 到 各 有 不 同 ， 
这 样 ， 我 们 便 可 以 观察 到 更 多 不 同 的 藻 动 、 行 为 和 现 家 。 直 接 观察 是 一 种 十 分 消耗 精力 的 收集 数 
据 方法 , 调查 人 员 必 须 每 天 化 很 长 时 间 跟 随 调查 对 象 。 这 也 限制 了 能 研究 的 对 象 的 数量 ， 所 以 我 
们 选择 少量 的 调查 对 象 ， 并 尽量 多 地 观 罕 他 们 里 上 出 现 的 情况 。 

分 析 数 据 使 用 的 方法 是 扎根 理论 。 扎根 理论 是 一 种 定性 研究 的 方法 , 即 研究 者 们 只 从 自己 
得 到 的 数据 中 生成 结论 , 而 不 古 先 假设 一 个 结论 然后 去 证 明 它 。 当 我 们 并 不 确定 将 得 到 什么 样 的 
数据 ,也 不 知道 哪些 数据 将 会 是 最 重要 的 时 候 ， 这 种 方法 就 比较 实用 。 扎 根 理论 采用 三 个 步骤 来 
分 析 数 据 。 








(1) 开放 式 编号 
记录 中 的 每 条 数据 都 彼 加 上 了 一 个 或 多 个 标签 ， 用 来 对 其 描述 。 
(2) 主轴 编号 


将 开放 却 编 三 的 各 个 标签 相互 关联 ,用 来 展示 因 采 关系 、 调 市 措施 以 及 由 于 一 个 行为 所 
导致 的 男 一 个 行为 。 
(3) 主题 编号 

所 有 的 标签 和 他 们 之 间 的 联系 被 串 成 一 个 完整 的 故事 线 , 而 这 条 故事 线 通常 就 是 最 终结 
论 的 基础 。 

在 这 一 习 中 ， 我 们 将 详细 介绍 我 们 的 观 聚 和 分 析 方 法 ， 并 展示 一 些 我 们 所 得 到 的 原始 
数据 。 


26.1.1 研究 对 象 


我 们 选择 了 微软 新 招 的 8 位 开发 人 员 。 在 调查 开始 的 时 候 , 他 们 在 微软 工作 的 时 间 在 1~7 个 月 
之 间 。 我 们 确定 了 25 个 可 能 的 研究 对 象 (基于 经 理 的 批准 和 时 间 安 排 上 的 考虑 )， 并 在 考虑 了 学 
历 和 职务 分 步 的 情况 下 ， 最 终 选 定 了 7 位 男士 和 1 位 女士 ， 共 8 位 开发 人 员 进 行 研 究 。 在 这 些 开发 
人 员 中 ，4 位 有 学 士 学 位 ，1 位 有 硕士 学 位 ，3 位 有 博士 学 位 ， 并 且 所 有 人 的 专业 都 征 计算 机 科学 
或 者 软件 工程 学 。 其 中 ， 有 2 位 是 在 美国 获得 的 本 科学 位 ，2 位 在 中 国 ，1 位 在 到 西 可 ，1 位 在 巴 基 
斯 坦 ，1 位 在 科威特 ，1 位 在 谢 大 利 亚 。3 位 博士 的 博士 学 位 均 古 在 美国 大 学 获得 。 我 们 还 尽量 选 
择 了 软件 开发 经 验 最 少 的 开发 人 员 ( 即 除了 有 限 的 实习 之 外 没有 任何 工作 经 验 )， 除 了 一 位 来 自 
澳大利亚 的 开发 人 员 , 他 在 微软 之 前 有 两 年 的 开发 经 验 。 参 与 者 们 每 周 将 得 到 50 美 元 作为 参与 研 
FEAT TRAM 

每 一 轮 观 察 的 时 间 龙 两 个 星期 。 在 两 个 星期 里 , 我 们 每 天 观察 这 些 开发 人 员 6~11 个 小 时 , 一 
轮 完毕 之 后 间 隅 一 个 月 ,然后 继续 下 一 轮 观察 。 我 们 在 不 打扰 调查 对 象 工作 的 情况 下 对 他 们 进行 
观 父 ， 跟 随 他 们 到 各 种 会 议 ， 并 观察 他 们 如 何 与 周围 的 同事 和 朋友 进行 交往 。 我 们 将 所 观察 到 的 
事情 连同 发 生 时 间 记 录 下 来 ， 形成 将 要 分 析 的 数据 。 和 电视 上 常见 的 真人 郁 类 似 ,， 开发 人 员 们 还 
锌 要 求 在 每 个 非 观 察 日 结束 的 时 候 了 永 制 一 段 视频 日 记 。 我 们 了 要求 他 们 在 视频 中 谈 一 谈 当天 最 有 趣 
的 事情 ， 然 后 对 他 们 的 大 学 教育 或 者 现在 工作 的 茶 些 方面 进行 回顾 。 
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26.1.2 任务 分 析 


在 扎根 理论 的 开放 式 编 号 阶段 ,我们 通过 审视 观察 记录 找 出 这 些 新 手 们 所 做 的 事情 ， 然 后 
给 这 些 事情 加 上 一 到 两 个 任务 或 者 子 任务 类 型 。 表 26-1 展 示 了 所 使 用 的 任务 分 类 。 淮 例 来 说 ， 
如 末 新 手 问 同事 条 个 API 在 哪里 定义 的 ， 那 么 这 条 记录 的 分 类 就 将 是 “编程 /搜索 ”和 “沟通 / 
[rl [Fr] ed o 


表 26-1 新 手 执行 的 任务 ， 按 频率 排序 


ti 程 读 、 写 、 加 注释 、 校 对 、 代 码 审阅 

解决 bug 重 现 、 报 告 、 排 优先 级 、 调 试 

测试 写 、 运 行 

项 目 管理 提交 代码 、 竺 出 代码 、 复 原 代码 

文档 读 、 写 、 搜 索 

规范 读 、 写 

工具 BA. Tk. RoR. EH, E 

沟通 问 问题 、 说 服 他 人 、 和 他 人 协调 、email、 参 加 会 议 、 准 备 会 议 、 找 人 、 和 领导 交流 、 


教 别 人 、 向 别人 学 习 、 做 导师 


26.1.3 ”任务 案例 


在 这 一 节 ， 我 们 将 描述 一 下 参与 者 被 观察 的 情况 ， 以 及 相关 的 任务 记录 ( 表 26-2 所 示 )。 
Timothy 被 指派 去 修复 一 个 pug。 在 看 文档 学 习 了 重 现 pug 的 五 个 步骤 之 后 ， 他 试 着 照 做 ， 但 是 第 
一 个 步骤 就 失败 了 。 在 45 分 钟 内 , 他 尝试 用 各 种 方法 来 进行 调试 , 包括 交换 软件 库 甚 至 交换 电脑 ， 
但 是 还 是 没 能 成 功 。 他 走 到 另 一 个 办 公 室 去 寻求 同事 Abdul 的 帮助 。Timothy 说 明了 目 己 所 试 过 的 
步骤 ， 但 是 Abdul 说 他 和 弄 错 了 。 然 后 Abdul 和 他 一 起 回 到 了 他 的 办 公 室 ， 然 后 发 现 Timothy 原 来 是 
将 错误 的 软件 库 复 制 到 了 他 的 电脑 。 在 告诉 他 正确 的 库 在 哪儿 之 后 Abdul 返 回 了 自己 的 办 公 室 。 

不 过 这 个 错误 软件 库 的 问题 是 由 Timothy 的 调试 方法 所 引起 的 ， 并 不 是 真正 的 问题 所 在 。 
Timothy 又 用 了 12 分 钟 来 重 现 这 个 bug， 然 后 又 找到 Abdul， 各 诉 他 还 是 有 问题 。Abdul 更 详细 地 解 
释 了 Timothy 复 制 的 那些 程序 库 ， 让 Timothy 意 识 到 他 对 于 这 些 程序 库 和 其 应 该 放置 的 目录 的 理解 
是 错误 的 。Abdul 告 诉 了 Timothy 正 确 的 理解 ， 并 回想 了 当年 他 如 何 英 勇 解决 调试 故障 的 故事 ， 然 
后 告诉 了 Timothy 另 一 些 角 用 的 调试 方法 ， 就 又 让 Timothy 回 去 了 《Abdul 所 说 的 方法 Timothy 都 已 
经 试 过 了 )。Timothy 没 有 继续 请 Abdul 帮 忙 ， 而 是 想 去 尝试 所 有 Abdul 教 他 (而 他 认为 没 用 ) 的 正 
确 理 解 下 的 方法 。 然 后 他 又 花 了 25 分 钟 自 己 进行 调试 和 测试 ， 但 是 还 是 不 能 完成 党 一 个 重 现 bug 
的 步骤 ， 最 后 什么 也 没 做 成 。 

表 26-2 Timothy 的 活动 记录 ， 按 任务 和 子 任务 分 类 


时 间 ja o 任务 / 子 任务 类 型 
11:45:43 AM 重新 运行 复制 脚本 解决 bug/ 重 现 
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(2%) 
时 间 fe 述 任务 / 子 任务 类 型 
11:46:18 AM 脚本 运行 完成 。 检 查 输出 并 确保 其 正确 。 脚 本 给 了 警告 说 文 解决 bug/ 重 现 
件 没 有 签名 。 关 于 源 目 录 的 邮件 又 说 文件 是 签 了 名 的 。 奇 怪 。 
复制 成 功 了 ,但 是 生成 的 三 进 制 文件 没有 签名 
11:47:26 AM 摇头 。Timothy 很 困惑 。 组 长 说 这 些 文件 是 签 了 名 的 。 但 是 事 解决 bug/ 重 现 
实证 明 没 签 
11:48:11 AM Timothy 说 可 能 他 应 该 目 己 为 这 些 文件 签名 
11:48:36 AM Timothy 自 言 自 语 :“ 坏 了 坏 了 ” 
11:56:23 AM Timothy 穿 过 走廊 去 问 Abdul 这 是 什么 器 题 沟通 /回回 题 
11:56:35 AM Timothy 解 释 了 当前 状况 ，Abdul 并 不 同意 ， 然 后 两 人 一 起 到 沟通 /加 他 人 学 刁 
了 Timothy 的 办 公 室 ,最 后 Abdul 说 Timothy 复 制 错 文件 了 ， 和 签 
名 不 签名 没关系 。 他 现在 复制 了 正确 的 文件 (仍然 是 未 签名 
的 ),， 不 需要 重启 
11:57:27 AM 程序 可 以 运行 了 解决 bug/ 重 现 
11:57:49 AM 再 次 尝试 重 现 这 个 bug。URL 可 以 用 了 。 重 现 失败 。Timothy 解决 bug/ 重 现 





表现 出 了 迷惑 一 一 我 怎么 才能 重 现 这 个 bug 呢 ? 调试 和 非 调试 
版 本 的 程序 都 不 能 重 现 


26.1.4 做 回顾 的 方法 


在 非 观 察 日 ， 这 些 参与 者 们 都 将 录制 一 份 3~5 分 钟 的 视频 日 记 。 我 们 准备 了 40 个 问题 ,大 部 分 
参与 者 都 选择 了 在 视频 中 回答 前 20 个 问题 ， 有 一 个 人 回答 了 35 个 。 数 量 的 不 同 来 产 于 缺席 ， 疫 有 
时 间 和 我 们 所 做 观察 的 数量 。 我 们 观看 了 视频 并 记 下 了 13 个 和 学 习 以 及 大 学 经 历 有 关 问 题 的 答案 。 





26.1.5 有效 性 问题 


在 我 们 所 做 的 这 种 基于 个 人 经 难 的 定性 研究 中 ， 稼 前 会 参 杂 人 现实 生活 中 的 各 种 复杂 因素 。 
在 调查 样本 如 此 小 ， 而 且 每 个 人 的 经 历 又 都 各 有 不 同 的 情况 下 ， 我 们 目 然 很 难 100% 确 定 到 底 古 
什么 造成 了 我 们 观 峙 到 的 结 末 。 而 我 们 的 研究 方法 以 及 各 个 参与 者 都 有 可 能 造成 结 采 的 侦 差 。 

我 们 的 研究 对 象 来 自 于 不 同 的 教育 背景 , 而 且 在 研究 开始 的 时 候 分 别处 在 个 人 和 职业 发 展 的 
不 同 阶段 。 此 外 ， 在 我 们 进行 研究 的 两 个 月 里 ， 每 个 人 的 改变 和 所 学 到 的 东西 又 各 有 不 同 。 虽 然 
在 这 种 情况 下 我 们 很 难 对 数据 做 横 癌 比较 ,不 过 这 疫 有 关系 ,因为 我 们 的 研究 主要 关注 的 正 征 新 
手 的 这 种 学 习 效 应 。 

在 我 们 的 研究 中 不 可 避免 的 一 种 偏差 是 霍 柔 效 应 (Hawthrone effect), ， 即 观察 者 的 存在 会 改 
变 被 观察 者 的 行为 。 我 们 相信 我 们 连续 而 长 时 间 的 观察 将 使 各 位 参与 者 慢 慢 适应 。 在 耳 究 结束 的 
时 候 , 我 们 询问 各 位 参与 者 是 否 留 意 到 目 己 在 行为 上 有 任何 变化 , 但 是 大 多 数 人 只 是 说 当 我 们 在 周 
围 的 时 候 他 们 的 休息 少 了 一 些 。 为 了 避免 公司 的 层级 结构 市 来 的 偏差 , 我 们 请 楚 地 加 新 人 及 他 们 的 
经 理 们 说 明 , 所 有 数据 都 将 是 隐私 的 ， 我们 也 不 会 对 任何 人 公开 这 个 数据 ,包括 公司 的 管理 层 。 此 
外 ， 我 们 也 采取 了 各 种 措施 来 确保 我 们 的 参与 者 们 不 是 被 目 己 的 经 理 强 坦 参与 钱 究 的 。 在 任何 时 
fe, 包括 在 研究 完成 以 后 , 参与 者 都 可 以 退出 研究 并 删除 和 自己 相关 的 数据 。 不 过 并 没有 人 这 样 做 。 
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在 阅读 我 们 的 研究 结 来 的 时 候 ， 有 一 点 必须 记 住 ,开发 人 员 们 认为 自己 需要 的 信息 ， 并 不 能 
完全 代表 做 好 开发 真正 需要 的 信息 。 尤 其 是 由 于 采用 了 不 打扰 的 劳 观 式 研究 方式 , 使 得 我 们 发 现 
很 多 新 手 有 时 候 并 没有 意识 到 他 们 其 实 需 要 条 些 信 息 。 也 就 古 说 ,他 们 可 能 像 没 头 仓 蝇 似 地 乱 转 ， 
停止 前 进 的 步伐 , 然后 就 换 其 他 的 任务 做 或 者 做 一 些 不 相关 的 事情 。 而 在 观察 者 眼中 ， 如 来 他 们 
能 了 解 到 条 些 信 息 ， 就 能 够 有 所 进展 。 特 别 是 ， 我们 观察 到 很 多 时 候 新 手 们 并 没有 意识 到 他 们 应 
该 从 同事 那儿 寻找 信息 ,来 帮助 自己 完成 任务 。 我 们 的 数据 显示 ， 新 手 们 第 第 做 那些 可 能 不 应 该 
他 们 做 的 事情 。 


26.2 ”软件 开发 任务 
在 这 一 节 中 ,我 们 将 展示 一 些 新 手 遇 到 的 软件 开发 任务 的 技术 细节 ,统计 他 们 在 这 些 细节 上 所 
花 时 间 的 分 布 情况 ， 并 展示 一 些 他 们 在 完成 任务 时 常 做 的 一 些 事情 。 那 些 最 消耗 时 间 的 事务 正好 是 
一 个 不 错 的 分 析 对 象 ， 可 以 让 我 们 确定 我 们 的 大 学 计算 机 科学 教育 有 没有 涉及 到 这 些 较 难 的 事务 。 
图 26-1 展 示 了 我 们 的 新 手 所 花 在 各 项 任务 上 的 时 间 (已 规范 化 并 显示 为 百分比 )。 各 个 项 目 
的 柱状 图 之 间 可 以 做 横向 或 者 纵 问 比较 ， 例如， 根据 柱状 图 的 长 度 ， 我 们 可 以 看 到 Timothy 花 时 
间 最 多 的 事务 是 沟通 。 
任务 分 析 
大 部 分 参与 调查 的 新 手 们 都 把 很 大 一 部 分 的 时 间 花 在 了 沟通 上 。 沟通 包括 会 议 (组 织 上 的 和 自 
发 的 , 由 不 同 数量 同事 开 的 会 议 )、 认识 和 了 解 团队 成 员 (以 及 他 们 的 代码 和 工作 内 容 )、 寻求 帮 助 、 
接受 帮助 、 帮 助 他 人 、 说 服 他 人 、 和 他 人 进行 协调 工作 、 和 寻求 反馈 (如 对 于 代码 的 反馈 ) 和 找 人 。 
Radoslaw (8.75) P UUs 
Timothy OR | 
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被 观察 者 名 字 后 面 的 括号 里 的 是 总 观察 时 间 (以 小 时 为 单位 ) 
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1. 沟通 

Wallace、Xavier 和 Timothy 花 费 了 绝 大 多 数 的 时 间 在 沟通 上 。 他 们 都 参与 了 多 个 会 议 并 在 解 
决 bug 的 过 程 中 寻求 了 他 人 的 帮助 。Wallace 的 沟通 时 间 非 常 多 是 因为 他 所 属 团队 的 沟通 非常 容 
易 一 一 他 在 一 个 “ 牛 棚 ”(bull pen， 大 型 公共 办 公 室 ) 式 的 团队 内 工作 ， 和 其 他 4 个 开发 人 员 一 
起 。 大 家 不 但 在 平常 时 候 常 第 直接 以 “说 ”的 方式 寻求 帮助 解决 问题 ， 而且 还 在 出 现 紧 急 情 况 的 
时 候 也 这 样 做 。 

Xavier 以 及 Yadav 两 人 与 其 他 人 相 比 花费 了 更 多 的 时 间 在 沟通 上 ， 不 过 除 此 以 外 他 们 还 分 别 
在 另外 的 任务 上 花 了 很 多 时 间 。Xavier 花 费 了 大 量 的 时 间 来 和 他 的 团队 中 负责 功能 的 领导 以 及 另 
外 一 个 产品 的 团队 开会 讨论 设计 同 题 。 他 还 经 常 和 团队 中 的 其 他 新 人 一 起 做 结对 编程 和 结对 调 
试 。Yadav 也 花费 了 一 些 时 间 在 bug 优 先 级 排列 会 议 上 , 但 更 多 的 时 间 是 用 来 是 用 来 写 代 码 , 这 个 
时 间 通 常 还 包括 阅读 文档 来 学 习 写 代码 的 方法 。 此 外 ，Yadav 第 第 使 用 即时 消息 工具 作为 和 团队 
中 其 他 有 经 验 的 成 员 沟 通 编程 方面 问题 的 工具 。 

对 Radoslaw 来 说 大 部 分 的 沟通 时 间 是 用 来 做 协调 。Radoslaw 的 任务 要 求 他 和 多 个 队友 一 起 分 
析 和 协调 进行 基准 测试 ,并 将 收集 到 的 结 末 做 成 报告 。 测 试用 机 堪 的 数量 有 限 ， 需 要 他 做 很 多 协 
调 工 作 。 同 样 需要 协调 的 还 有 共享 测试 结果 报告 的 开发 。 

总 的 来 说 ,沟通 对 于 新 手 是 既 重 要 而 又 常规 的 一 件 事 。 他 们 用 沟通 来 寻求 帮助 ， 并 用 沟通 来 
学 习 和 理解 他 们 的 团队 的 工作 方式 。 另 外 , 我 们 所 列 出 的 新 手 所 做 的 任务 列表 可 能 还 不 足以 强调 
沟通 的 重要 性 。 如 果 新 手 花 更 多 时 间 在 和 同事 的 沟通 上 上， 他们 可 能 就 能 更 有 效 地 获取 信息 了 。 

2. 文档 

对 于 Radoslaw、Timothy、Vadim 和 Yadav 来 说 ， 第 二 篆 见 的 任务 是 和 文档 相关 的 事务 。 在 编 
程 和 调试 中 , 文档 相关 的 任务 包括 搜寻 、 了 阅读 和 理解 文档 (通常 是 网 页 形式 的 API 文 档 ) ， 为 的 是 
领会 旧 代 码 并 学 写 新 代码 。 新 手 还 需要 写 bug 报 告 和 规格 计划 等 文档 。 最 后 ， 新 手 常常 需 要 自己 
保存 一 份 文档 来 记录 项 目的 管理 和 工具 的 情况 , 或 者 用 来 记录 他 们 需要 在 会 议 中 展示 的 东西 。 多 
个 研究 对 象 问 研 究 人 员 提 出 ,保持 和 整理 这 些 个 人 记录 是 很 费劲 的 事情 。 他 们 缺乏 管理 这 些 记录 
的 规范 ， 并 希望 在 管理 这 些 记录 的 过 程 中 得 到 一 些 帮助 。 

Radoslaw 和 Vadim 比 其 他 人 在 文档 上 花费 了 更 多 时 间 。 两 人 的 时 间 都 主要 花 在 了 读 文档 上 ， 
包括 来 自 文件 ”” MSDN、 网 页 和 电子 邮件 的 文档 ， 以 帮助 他 们 了 解 他 们 团队 的 代码 。 这 是 其 他 工 
E (比如 写 代 码 ， 或 者 安装 /建立 开发 环境 ) 的 连带 结果 。Vadim 认 为 把 时 间 花 在 这 样 高 强度 的 阅 
读 上 并 不 十 分 划算 ,但 是 作为 一 个 新 人 ， 他 也 没有 别 的 途径 来 学 习 了 。 

3. 解决 bug 

第 三 常见 的 事情 就 是 解决 bug 了 。 不 同 开发 人 员 之 间 调 试 和 除 错 的 频率 差别 非常 大 ， 因 为 这 
个 由 每 个 开发 人 员 所 处 的 开发 阶段 而 定 。 我 们 发 现 Yadav 和 Timothy 常 常 参 加 bug 的 讨论 会 议 ， 而 
Wallace 的 团队 虽然 有 实体 和 虚拟 的 bug 人 研讨 会 ,但 是 并 没 看 到 他 参加 。 我 们 发 现 每 个 参加 者 都 曾 
经 重 现 过 bug (有 了 时 仅 靠 他 们 自己 ), 并 了 解 过 这 些 bug 发 生 的 原因 。Zach 非 常 专 注 于 调试 和 除 错 ， 
并 认为 减少 错误 就 是 成 功 。 其 至 曾经 有 一 段 时 间 , 他 依靠 模式 匹配 修改 的 方法 每 天 都 批量 解决 几 
百 个 bug。 我 们 观 罕 到 的 其 他 的 调试 任务 包括 代码 的 测试 、 浏 览 和 搜索 。 
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4. 编程 

有 三 个 新 手 (Umakanth、Yadav 和 Zach) 都 在 添加 新 功能 上 花 了 时 间 ， 其 中 的 任务 包括 编程 、 
规格 文档 和 调试 。 写 代码 和 学 习 代 码 的 开发 人 员 常 剃 也 需要 参与 文档 的 制作 来 理解 代码 和 API 古 
如 何 工作 的 《有 时 也 靠 模 仿 在 线 的 代码 例子 来 学 习 )。 尤 其 是 为 了 支持 调试 的 工作 而 编程 的 时 候 ， 
我 们 发 现 新 手 们 会 在 代码 中 浏览 和 搜索 一 一 一 个 对 他 们 来 说 比较 难 掌 握 的 过 程 。 最 后 , 我 们 注意 
到 新 手 们 都 非常 尽 贡 地 在 写 广 释 。 有 时 候 , 他们 其 至 会 在 读 代 码 解决 故障 的 过 程 之 中 给 儿 行 无 需 
修改 的 代码 也 加 上 注释 。 他 们 在 努力 地 学 习 和 熟悉 代码 的 过 程 中 非常 喜欢 注释 ,而 且 他 们 也 很 愿 
意 添加 注释 。 

Umkanth 的 第 一 个 项 目 是 设计 和 实现 一 个 程序 问 导 对 话 框 。 这 个 对 话 框 的 实现 基于 他 从 没 用 
过 的 API。 他 大 部 分 的 时 间 都 花 在 了 编程 上 ， 但 主要 是 因为 他 选择 了 一 个 低 效 的 学 习 方 法 ， 即 一 
abst AOS. 如果 他 花 多 一 点 的 时 间 去 寻求 帮助 而 不 是 自己 一 个 人 研究 代码 的 话 ， 可 能 会 更 
有 效率 ， 也 不 至 于 那么 郁 问 。 

Xavier 的 工作 基于 去 年 夏天 的 一 个 实习 生 所 写 的 代码 ， 而 这 个 实习 生 现在 已 经 离职 了 ， 无 法 
回答 关于 代码 的 问题 。Wallace 之 前 在 一 个 网 站 服务 公司 工作 。 在 那里 的 工作 需要 持续 不 断 地 添 
加 各 种 小 功能 和 修改 备 种 小 bug。 由 于 Wallace 之 前 没 见 过 这 样 的 代码 库 , 他 经 浓 问 同事 很 多 问题 。 
此 外 ，Wallace 还 和 其 他 4 个 在 类 似 项 目 中 较 有 经 验 的 开发 人 员 一 起 在 一 间 公 共 办 公 室 里 工作 。 他 
们 每 个 人 都 可 以 回答 Wallace 遇 到 的 问题 《有 时 也 会 问 Wallace 问 题 ) ，Wallace 不 用 专门 去 找 基 一 个 
All. 

5. 项 目 管理 及 工具 

我 们 观察 到 ， 新 手 们 会 做 很 多 项 目 管理 及 工具 相关 的 事情 ， 例 如 使 用 版 本 控制 系统 ， 编 译 他 
们 的 程序 ， 安装 开发 环境 ,运行 辅助 工具 和 创建 一 些 用 于 广 持 项 目 管理 和 流程 的 小 工具 。 项 目 管 
理 和 工具 相关 的 事务 似乎 占用 了 新 手 们 过 多 的 时 间 。 更 重要 的 是 , 这 些 事务 往往 会 打 断 他 们 的 工 
作 。 一 个 极端 的 案例 是 ， 我 们 资历 最 浅 的 研究 对 象 (Vadim) 因为 项 目 相 关 杂 务 的 奉 绊 而 完全 疫 
办 法 开始 配置 开发 环境 。 还 有 Zach， 他 所 在 的 团队 当时 正 处 在 一 个 修改 bug 的 阶段 ， 而 他 分 到 的 
任务 则 是 解决 1300 个 新 的 编译 器 警 告 。 他 把 每 一 批 解决 的 编译 如 警 告 分 别 存 为 不 同 的 检查 表 , 而 
每 个 检查 表 都 需要 和 同事 一 起 协商 进行 代码 审核 再 提交 到 版 本 控制 系统 。 

6. 设计 规格 文档 和 测试 

在 设计 上 花费 的 时 间 主 要 取决 于 新 手 开 发 的 项 目 所 处 的 阶段 。Xavier 和 Wallace 都 花费 了 大 量 
的 时 间 来 理解 和 编写 设计 文档 。Zach 所 在 的 项 目 中 测试 花费 的 时 间 尤 其 多 。 其 他 的 儿 个 新 人 也 在 
测试 上 花 了 一 些 时 间 。 


26.3 ”新 手 开 发 人 员 的 优点 和 缺 后 
我 们 的 观察 结果 揭示 了 新 手 开发 人 员 的 各 种 优点 和 缺点 。 他 们 的 强项 包括 ， 


O 编程 ; 
口 阅读 和 编写 规格 文档 ， 
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O 调试 (执着 并 且 能 尝试 寻找 原因 )。 
缺点 包括 : 

O 沟通 ， 

O 意识 ; 


D 适应 性 (适应 大 的 代码 库 以 及 和 现 有 团队 的 合作 )。 
26.3.1 faa 


我 们 通过 观察 发 现 , 这 几 位 软件 开发 新 手 都 在 大 学 里 面 萤 担 了 很 好 的 编程 .设计 和 调试 技能 。 
他 们 会 用 集成 开发 环境 CIDE) 来 写 代码 ， 用 命令 行 的 工具 来 分 析 文 件 ， 并 利用 在 线 文 档 来 学 习 
不 熟悉 的 API。 他 们 不 只 是 纯粹 地 完成 任务 ， 还 想 弄 明白 为 什么 代码 应 该 这 样 修改 。 他 们 中 的 一 
些 人 使 用 了 “复制 粘贴 大 法 ， 从 各 类 文档 和 同 组 的 其 他 人 写 的 代码 中 把 需要 的 部 分 粘贴 过 来 。 
在 调试 的 时 候 ， 所 有 的 新 手 们 都 曾 积极 地 试 着 自己 寻找 出 错 的 原因 (参见 26.1.3 市 )， 并 坚持 党 试 
所 有 的 可 能 解决 方法 ， 如 条 不 行 才 放 弃 。 他 们 中 大 部 分 人 在 解决 问题 的 过 程 中 ， 都 耐心 地 经 历 了 
一 次 又 一 次 地 失败 。 虽 然 他 们 也 目 言 自 语 地 说 一 些 类 似 于 “不 熟悉 工具 啦 ” 或 者 “没有 使 用 说 明 
啦 ” 一 类 的 抱 忽 ， 但 是 却 很 少 把 这 个 想法 告诉 给 其 他 人 。 

有 一 个 新 手 的 工作 是 要 检查 软件 的 两 个 功能 的 设计 文档 , 这 个 任务 融 来 的 影响 就 是 他 需要 频 
蒙 地 和 组 长 进行 讨论 , 进而 需要 进而 证 清 设计 的 细 让 以 及 曾 述 具体 的 使 用 和 案例。 这 个 经 历 让 他 在 
第 二 个 月 中 过 得 比较 舒服 , 在 此 期 间 他 独立 写 了 元 长 的 结构 化 开发 规格 文档 。 这 里 我 们 不 得 不 提 
到 这 个 组 长 出 色 的 指导 能 力 。 他 非常 开放 地 回答 各 种 问题 ,指导 组 员 的 工作 ,传授 以 往 学 到 的 关 
于 代码 和 设计 工作 的 一 些 背 景 知识 , 而 且 对 于 目前 这 个 阶段 的 设计 文档 需要 包括 的 内 容 他 也 提出 
了 目 己 的 建议 。 


26.3.2 ”缺点 分 析 


我 们 发 现 新 手 们 在 受 观 察 期 间 在 沟通 、 人 合作、 意识 和 适应 性 上 遇 到 了 许多 问题 。 

新 手 们 的 沟通 问题 中 最 突出 的 是 不 知道 何 时 及 怎样 来 辣 问 题 。 一 般 来 说 ， 新 手 癌 问题 并 不 及 
时 ， 而 且 也 不 知道 应 该 问 到 什么 程度 。 有 时 候 他 们 在 设计 会 议 中 太 过 于 注重 细 攻 。 而 在 癌 问 题 
的 时 候 ， 他 们 又 问 得 太 党 统 ， 而 且 在 别人 回答 目 己 问题 的 时 候 也 没有 完全 和 弄 明日 ， 往 往 最 后 时 
致 误解 。 

我 们 留意 到 的 社交 方面 的 问题 主要 集中 在 在 大 型 团队 中 工作 、 与 多 个 团队 进行 合作 以 及 适应 
大 型 的 现 有 代码 库 上 。 很 多 时 候 ， 新 手 们 被 明确 告知 : 书面 文档 几乎 没有 ， 而 且 原 来 负 贡 这 个 功 
能 的 开发 人 员 也 已 经 离职 了 。 这 通常 意味 着 类 似 于 “(要 想 要 文档 ) 只 能 靠 自 己 ” 和 “以 后 的 日 

会 很 痛 雷 ， 因 为 可 以 辣 的 人 也 没有 ”。 

团队 和 学 校 在 规范 上 的 区 别 让 很 多 新 手感 到 困惑 。Timothy 吃 尽 吉 头 后 才 明 昌 了 他 所 在 团队 
的 开发 流程 。 他 曾经 修复 了 一 个 bug， 并 提交 等 竺 检查 。 然 而 ， 他 的 这 个 修复 被 驳回 ， 最 后 没有 
被 包括 到 发 布 的 程序 中 。 而 且 被 驳回 的 原因 并 不 是 他 所 预想 的 代码 质量 问题 ,而 是 经 理 们 (AES 
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一 个 组 ) 没有 时 间 来 批准 这 个 修复 。 虽然 Timothy 认 为 他 可 以 为 客户 解决 一 个 bug, 但 这 次 为 了 “不 
添乱 ， 他 仍然 乖乖 地 接受 了 经 理 们 的 决定 。 他 认识 到 开发 人 员 的 工作 不 只 是 编程 ， 在 茶 些 情况 
下 ， 他 们 还 必须 在 工作 中 推销 上 自己 的 代码 和 思想 。 一 个 月 后 ，Timothy 再 次 面临 了 这 个 问题 ,但 
这 次 他 的 准备 就 充分 多 了 。 在 给 bug 的 修复 排 优先 级 的 会 议 上 , 他 井井有条 地 曾 述 了 他 发 现 鸭 bug 
的 情况 ， 并 详细 说 明了 他 解决 bug 的 过 程 ， 以 促使 经 理 们 批准 。 

新 手 们 费劲 地 收集 、 整 理 了 他 们 需要 学 习 的 文档 ， 并 做 好 记录 。 有 一 个 新 手 回忆 到 目 己 做 笔 
记 的 情形 ， 说 :“ 笔记 总 征 很 乱 ， 我 目 己 稍稍 都 不 明白 我 写 的 是 什么 。 真 硕 望 我 能 有 一 个 更 好 的 
方式 来 做 笔记 。 即 兴 的 小 课 党 (比如 在 新 手 的 电脑 前 指导 一 下 如 何 使 用 版 本 控制 或 者 bug 数 据 库 ) 
通 第 都 没有 什么 条 理 , 在 词语 的 选择 上 一 般 也 没 用 外 到 新 手 的 背景 和 文化 情况 ,在 这 类 情况 下 ， 
“老师 ” 们 通常 像 连珠 炮 一 般 迅 速 地 就 讲 完 了 ， 使 得 新 手 常 兽 怕 浪费 老师 的 时 间 而 不 敢 打 断 老师 
FARIA] ale. na A te H A BY AG E eC ARSE, tn Le AEA 

新 手 们 难以 适应 项 目 团队 、 代 码 库 和 各 种 资源 造成 的 信息 不 足 的 环境 。 不 过 ， 有 时 候 这 和 组 
织 混乱 以 及 笔 理 不 碍 的 文 要 有 很 大 的 关系 。 对 于 新 手 来 说 , 这 样 的 文档 难以 被 高 效 地 剖 览 和 使 用 。 
而 新 手 还 在 另 一 个 问题 上 挣扎 ， 那 就 是 “什么 时 候 我 该 不 知道 。 因 为 要 学 的 东西 太 多 了 了， 他们 
慢 慢 习 惯 了 对 于 工具 或 者 代码 一 知 半 解 的 状态 ， 并 莹 试 目 己 独 目 学习。 虽然 现实 的 确 如 此 ,但 走 
这 样 的 习惯 使 得 很 多 新 手 在 确实 应 该 寻求 别人 帮助 的 时 候 却 认识 不 到 。 在 我 们 的 研究 对 象 中 , 资 
历 最 浅 的 新 人 第 第 出 现 这 种 情况 。 即 使 在 间 了 同 题 ,然后 得 到 了 一 个 舍 糊 不 清 的 答 委 的 时 候 ， 他 
也 仍然 接受 并 据 此 钻研 下 去 。 

A ape a eh A CAAMA MA, AULA CAAA ABU Nae, 也 不 知道 
某 一 类 问题 出 现 的 时 候 应 该 找 谁 〈 或 者 知道 找 谁 但 是 不 知道 他 的 办 公 室 ) 。 这 严重 地 影响 了 他 们 
的 效率 , 并 让 他 们 感觉 到 巨大 的 挫败 感 。 在 与 团队 的 隔 周 度 这 一 点 上 , 各 个 新 手 之 则 的 差别 很 大 。 
有 一 个 新 手 选 择 了 从 男 外 的 渠道 了 解 信息 , 然后 化 了 大 量 时 间 来 阅读 各 类 高 级 文档 , 希望 能 了 解 
他 所 在 团队 的 工作 情况 (最 后 基本 徒劳 无 功 )。 另 一 个 新 手 发 现 最 容易 了 解 信 息 的 方法 还 是 和 人 
交流 。 他 没有 去 搜索 各 种 文档 ， 而 是 到 处 去 找 同事 同 问 题 。 如 琳 要 找 的 人 不 在 或 者 不 知道 管 案 ， 
他 就 再 问 下 一 个 。 只 有 当知 道 答案 的 人 不 在 办 公 室 的 时 候 , 他 才 会 退 而 求 其 次 地 选择 效率 低 一 些 
的 学 习 方 法 ， 比 如 看 代码 或 者 做 一 些 测 试 。 






































26.4 [EEA 


Ha PARTS he a TAA Sa, TERA BE Be a T IENA E 
面 。 所 以 ,我们 需要 知道 新 手 对 于 他 们 工作 的 感悟 。 在 这 一 市 中 ， 我们 分 类 整理 了 一 些 新 手 做 视 
频 日 记 时 的 一 些 回顾 。 这 些 回 顾 将 帮助 我 们 更 深入 地 了 解 社交 和 层级 因素 对 于 新 手感 受 的 影响 。 

实践 证 明 ， 预 先 在 日 记 中 提供 的 问题 可 以 引导 新 人 们 反思 他 们 在 大 学 和 在 行业 中 学 习 的 感 
受 。 我 们 在 这 里 列 出 儿 个 回 党 最 多 的 问题 。 

O 你 的 大 学 经 历 对 你 在 微软 的 工作 提供 了 多 少 准 备 ? 

O 高 校 毕业 生 们 如 来 想 过 好 在 微软 的 头 一 年 ， 最 应 该 做 好 哪些 准备 ? 











26.4 ”回顾 a7] 


O WR “ACRE PR” MANE, PRT HLS Bea MT A? 

O 如 采 你 能 罕 越 时 光 见 到 刚刚 度 过 在 微软 第 三 个 星期 的 你 ， 你 会 给 他 什么 建议 或 者 忠告 ? 
D 你 怎么 知道 你 真 的 陷入 困境 了? 这 种 情况 下 你 又 怎么 办 呢 ? 

在 接 下 来 的 几 慷 中， 我们 将 分 析 和 总 结 新手 们 对 这 些 问题 的 回答 。 


26.4.1 管理 层 的 介入 


新 手 们 在 刚刚 入 职 的 时 候 立 刻 就 会 面临 一 个 窒 境 ,他 们 完 得 必须 要 向 他 们 的 经 理 证 明 他 们 多 
么 聪明 、 多 么 高 效 、 多 么 可 靠 一 一 即便 是 在 他 们 还 没完 全 搞 明 白人 他们 所 在 职位 具体 工作 的 情况 下 。 
然后 ， 由 于 他 们 想 要 在 短期 内 一 步 登 天 地 学 习 很 多 东西 ， 并 都 想 选 树 那 些 能 出 位 的 任务 ， 导 致 压 
力 和 焦虑 水 平 不 断 上 升 。 我 们 的 新 手 们 在 回顾 中 都 提 到 了 这 一 点 ,而且 大 都 会 后 悔 当 初 想 一 口吃 
成 个 胖子 的 学 习 态 度 。Timothy 说 :“ 你 不 需要 去 深入 了 解 某 一 个 部 分 ， 但 是 你 需要 对 每 个 东西 都 
有 一 定 的 了 解 一 一 太 专 了 不 行 。 钻 牛角 尖 会 让 你 花 很 多 时 间 ， 还 会 延误 任务 的 进展 。”Vadim 认 为 
他 应 该 花 更 多 时 间 来 学 习 :“ 在 刚刚 进入 公司 的 第 一 年 ， 在 不 工作 的 时 候 应 该 多 用 一 些 时 间 和 精 
力 在 学 习 新 技术 和 深 入 了 解 产 品 上 。 Wallace 回 忆 了 他 在 精神 上 的 高 压 :“ 我 可 能 会 告诉 当初 的 
目 己 不 要 有 大 大 压力 ， 要 冷静 地 对 竺 各 种 事情 ， 因 为 压力 对 工作 设 任何 帮助 。 反 正 你 在 学 习 ， 我 
也 在 学 习 ， 大 家 卿 在 学 ， 我 不 想 在 这 种 细 三 上 大 纠结 了 ……”Xavier 提 到 了 一 个 大 家 在 切入 职场 
的 时 候 者 不 愿 总 采用 的 方法 :“ 多 辣 他 人 辣 问 题 。“ 你 上 自己 需要 伦 一 整 天 来 看 代码 和 文档 来 解决 
的 问题 ， 问 别人 的 话 可 能 5 分 钟 就 解决 了 。”Vadim 这 样 说 道 。 经 常 问 问题 的 话 ， 同 事 和 领导 们 就 
会 知道 你 知识 上 有 从 缺 , 这 一 点 对 于 很 多 新 人 来 说 很 难 接受 ,因为 他 们 认为 这 样 会 让 领导 党 得 招 
A Jo 


26.4.2 ZI. RIMI A tA 


Perkins 等 人 将 新 手 程序 员 分 为 “ 浅 尝 辑 止 型 (stopper)” 和 “ 铅 而 不 舍 型 (mover)” WE, 
浅 尝 轻 止 型 新 人 很 容易 就 会 陷入 困境 然后 就 放弃 了 。 急 而 不 舍 型 的 新 人 会 和 尝试、 修正、 尝试 、 修 
正 ， 然 后 一 直 坚 持 到 问题 解决 为 止 。 我 们 所 有 的 研究 对 象 们 都 注意 到 了 毅力 的 重要 性 ， 有 效力 束 
容易 成 为 钢 而 不 舍 型 的 新 人 。Wallace 怀 别提 到 一 点 ， 那 束 是 “在 微软 有 一 种 不 言 放 弃 的 态度 …… 
如 末 是 我 提出 的 问题 ， 那 么 就 该 我 来 解决 。 去 上 司 那 儿 说 “这 个 我 搞 不 定 ” 古 行 不 通 的 …… 说 到 
底 ， 这 还 是 我 的 贡 任 。 

Perkins 所 出， 对 于 任务 不 确定 和 对 目 己 能 力 不 目 信 会 使 学 生 们 变 成 “ 浅 答 辑 止 型 。 不 过 ， 
我 们 的 观察 记录 显示 , 即便 是 非 营 有 效力 的 学 生 也 还 是 显示 出 了 对 任务 的 疑惑 和 对 目 己 能 力 的 怀 
疑 。 当 问 到 关于 这 类 问题 时 ， 我 们 的 新 手 们 都 没有 承认 他 们 有 小 答 加 止 型 的 特 点 ， 不 过 Wallace 
说 道 : 我 经 前 不 知道 我 其 实 已 经 销 入 牛角 尖 了 ， 该 寻求 帮助 了 。 但 我 还 是 问 着 头 不 断 答 试 直到 
找到 解决 方案 为 止 。 所 以 ， 刍 而 不 舍 并 不 意味 着 就 会 成 功 ， 有 了 时候 其 至 正好 相反 。 正 如 Xavier 
说 他 被 困难 卡 住 时 候 的 情况 :“ 当 我 已 经 党 试 过 所 有 已 知 的 方法 但 十 还 不 能 解决 问题 的 上 时候， 我 
才 知 道 我 被 卡 住 了 。 在 被 问题 困 住 而 无 法 取得 进展 的 时 候 ， 更 好 的 解决 方法 就 是 辐 别 人 寻求 帮 
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助 。 但 是 由 于 权力 上 的 不 对 等 以 及 社交 上 的 不 安 ,， 使 他 们 不 愿意 采取 这 个 方法 。 其 实 ， 我 们 观察 
的 新 人 中 的 有 一 部 分 确实 寻求 了 帮助 。Timothy 说 :“ 当 我 被 卡 住 的 时 候 ， 我 就 去 同一 个 资历 老 一 
些 的 队友 ， 看 看 他 们 以 前 有 没有 遇 到 过 类 似 的 问题 。 但 是 ， 多 数 情况 下 新 手 只 会 在 已 经 手 忙 脚 
乱 地 和 卉 了 很 长 时 间 ， 甚 至 伦 了 好 几 个 小 时 都 还 解决 不 了 癌 题 的 时 候 ， 才 去 问 别 人 。 

由 此 可 能 会 得 出 这 样 的 结论 , 对 工作 的 疑惑 和 对 目 己 能 力 缺乏 信心 等 都 属于 这 些 新 进 开发 人 
员 的 “新 人 特质 "， 而 不 古 由 学 习 编 程 3| 起 的 。 而 事实 上 ， 也 确实 有 组 织 机 构 管理 方面 的 研究 证 
明了 这 一 点 。 


26.4.3 ”大 型 的 软件 团队 环境 


新 人 们 的 回顾 表明 ， 他 们 在 软件 开发 的 技术 /职能 上 的 准备 得 很 充分 。Zach 说 : “我 完 得 我 不 
需要 学 更 多 的 技术 知识 了 。 但 是 ， 他 们 的 回顾 也 同时 表明 ， 他 们 在 社交 方面 的 准备 十 分 欠缺 。 
Vadim 提 到 : “在 大 学 里 面 我 们 的 团队 也 就 2~3 个 人 ， 而 且 项 目 之 间 无 需 合 作 。 不 止 是 我 ， 随 便 谁 
也 不 可 能 在 一 开始 就 准备 好 和 75 个 人 一 起 合作 ， 其 中 包括 35 个 开发 人 员 和 差不多 数量 的 测试 人 
员 ，( 我 还 必须 ) 跟 他 们 一 一 合作 。 沟通 不 畅 的 后 果 是 可 怕 的 〈 接 Vadim 前 面 说 的 ): “做 任何 事 
都 得 小 心 恤 村 地 不 去 破坏 任何 规矩 或 者 打扰 别人 。 Xavier 说道:“ 即 使 一 件 事 看 上 去 很 容易 ， 但 
有 时 做 起 来 也 很 难 。 一 个 看 上 去 很 小 的 修改 ， 结 末 可 能 需要 大 动 干戈 。 这 些 有 趣 的 连锁 反应 和 副 
作用 , 都 征 你 在 专注 于 菏 件 事情 时 所 想不到 的 。 与 队友 紧密 地 合作 是 取得 成 绩 的 有 效 途 径 之 一 。 
Wallace 说 道 :“ 我 认为 我 需要 的 是 团队 精神 方面 的 提高 …… 当 我 的 队友 们 取得 成 就 的 时 候 ， 或 者 
当 他 们 需要 帮忙 的 时 候 , 我 希望 能 够 把 他 们 的 目标 也 作为 我 的 目标 。 因为 他 们 的 成 功 就 是 团队 的 
成 功 ， 而 我 想 让 我 们 的 团队 更 成 功 。 最 后 ， 虽 然 我 们 并 不 知道 Xavier 在 大 学 的 时 候 有 没有 机 会 
和 更 多 的 人 一 起 参加 较 大 项 目的 开发 ,但 他 表示 他 还 是 希望 能 有 这 些 方面 的 经 验 : ” (我 早 该 ) 
和 其 他 人 一 起 做 项 目 然后 学 到 更 多 团队 合作 的 经 验 …… 而 不 是 自己 傻 傻 地 去 做 那些 只 有 一 个 星 
期 的 家 庭 作 业 。 


26.5 ”妨碍 学 习 的 误解 


在 观察 中 我 们 发 现 ， 很 多 时 候 新 手 们 的 一 些 误解 会 妨碍 他 们 和 同事 的 交往 。 
*HUUOUUUHUUUHUUUUUUUUUUUUUUUUO 

这 种 错觉 是 非 第 危险 的 , 特别 是 在 大 型 和 复杂 的 开发 环境 中 。 我 们 主要 在 非 美国 本 土 的 
新 人 里 上 看 到 这 一 上 感 。 他 们 认为 需要 “表现 ”而 不 要 被 “ 揭 短 ”"， 并 把 很 多 时 间 白 白浪 费 在 
挣 表现 上 了 。 这 种 挣 表现 的 行为 似乎 也 让 他 们 更 少 地 进行 询 通 ,并 需要 更 长 的 时 间 才 能 适应 
新 环境 。 有 时 新 手 会 很 钼 牛角 尖 地 独 目 解决 问题 ， 有 时 还 试图 掩盖 他 认为 他 “应 该 ”知道 但 
却 不 知道 的 问题 。 在 这 种 情况 下 ， 沟 通 就 更 困难 了 。 此 外 ,即使 队友 已 经 明确 告知 某 个 问题 
应 该 由 别人 解决 或 者 根本 没 必 要 解决 时 ,有 的 时 候 新 手 们 还 是 会 继续 在 上 面 浪费 时 间 。 虽 然 
我 们 调查 规模 非常 小 , 但 是 有 一 点 仍 值得 注意 ,， 那 就 是 在 来 自 美 国 本 土 的 新 员工 身上 没有 发 
现 这 样 的 问题 。 









































26.6 ”教育 方法 的 及 思 319 


EWA ARS, REIF REA T, REE S, k T A, 
在 最 后 全 究 结束 之 前 的 采访 中 ,参与 研究 的 新 手 们 很 多 都 表示 ,他们 当初 的 那些 担心 和 设想 
跟 现 实 完 全 不 同 。 
*UUUUbusUUUUUOU00UO0O0O0O0O0000 UU “UOUUUUUUUUUU 

OOL 

每 个 新 手 几 乎 部 有 这 个 错觉。 毕业 生 们 在 大 学 里 面 缺 乏 以 团队 为 基础 的 开发 经 验 , 又 必 
须 适应 严格 交付 期 限 的 打分 机 制 , 这些 也 许 是 井 成 这 个 错 完 的 原因 。 新 手 们 有 这 样 一 种 看 法 ， 
那 束 是 任何 东西 只 要 “用 不 了 ， 就 必须 立刻 修复 。 虽 然 他 们 很 明白 有 一 僚 成 文 的 规矩 来 报 
告 、 分 级 和 解决 bug, 但 是 他 们 第 第 还 是 图 方便 , 绕 开 这 些 步 最 来 解决 问题 。 有 的 新 手 被 “ 抓 
现行 ”的 时 候 ， 受到 了 批评 , 但 古 这 个 信念 似乎 已 经 非 泗 根深 蒂 固 了， 可 能 需要 更 多 的 时 间 
才能 慢 慢 改变 。 
e 00000000 +7 

比 起 误解 来 说 , AFERA R Be AIRERA RRK A EAR TT 
手 同 时 还 认为 ， 就算 文档 很 容 多 就 过 期 了 ， 他 们 还 古 希 望 越 多 越 好 。 此 外 ， 和 微 资 深 点 的 新 
手 还 希望 能 得 到 更 多 工作 环境 中 其 他 人 的 信息 , 即 具体 代码 和 具体 问题 的 负责 人 十 谁 。 这 起 
因为 他 们 已 经 营 识 到 软件 开发 的 复杂 性 和 紧 竣 的 时 间 安 排 使 得 文档 非常 有 限 , 而 在 这 种 情况 
下 ， 人 就 成 了 最 好 的 活 文 档 资 源 。 
e DOUO0UD00D00D00UDOUD0UUUUUUD 

上 面 这 句 话 有 四 个 新 手 (Umakanth, Timothy, Vadim, Zach) 说 过 ,但 是 实际 观察 到 
的 情况 正好 相反 。 很 明显 , 新 手 们 几乎 总 古 在 浪费 时 间 、 精力 和 钱 在 手忙脚乱 地 解决 问题 上 ， 
但 征 总 征 不 能 意识 到 他 们 应 该 寻求 帮助 了 。 这 个 结 东 也 许 不 令 人 意外 , 因为 在 计算 机 课程 中 
并 不 会 教授 元 认 知 的 拔 改 。 虽 然 新 手 们 第 第 被 一 个 问题 搞 得 精 疲 力 尽 ， 但 是 这 似乎 也 和 没 
有 人 告诉 他 们 怎么 来 认识 目 己 的 状况 ， 以 及 遇 到 环 元 的 情况 下 该 怎么 办 等 有 关系 。 值 得 注 
意 的 古 ， 虽 然 博 士 生 们 更 倾向 于 自我 审视 和 反省 ， 但 古 他 们 在 外 牛角 尖 方 面 和 本 科 生 没 什 
么 区 别 。 


26.6 ”教育 方法 的 反思 


在 这 一 慷 中 , 我 们 将 从 新 人 社会 化 的 角度 来 点 评 一 下 各 种 计算 机 科学 的 大 学 课程 设置 和 教育 
方法 。 我 们 之 前 提 到 的 软件 开发 技能 ， 如 编程 、 调 试 、 神 试 、 项 目 管理 、 编 写 各 种 文档 、 工 具 和 
沟通 ,等 等 ， 在 大 学 里 和 面部 有 不 同 程度 上 与 之 对 应 的 诬 程 。 对 于 每 个 技能 ， 我 们 邦 能 找到 Schein 
所 说 的 与 组 织 相连 的 三 个 层面 : 职务 、 层 级 和 社会 网 络 。 三 个 相对 比较 新 的 不 太 第 见 的 教学 方法 ， 
即 结对 编程 、 合 理 的 边际 参与 以 及 导师 制 , 正好 可 以 在 大 学 的 环境 下 解决 新 人 在 结构 和 社会 层面 
的 问题 。 我 们 强烈 建议 学 校 和 公司 更 广泛 地 使 用 这 些 方 法 。 


























元 认 知 是 对 认 知 活动 的 自我 意识 和 自我 调 三 。 一 一 编者 注 
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26.6.1 结对 编程 


参与 研究 的 新 手 们 都 完 得 惊讶 : 软件 开发 流程 中 葛 然 需要 如 此 多 的 沟通 。 辟 励 询 通 的 一 种 方 
法 是 结对 编程 练习 。 两 个 学 生 组 成 一 个 二 人 小 组 进行 开发 ， 相 互 配 合 着 编辑 代码 并 编写 文档 。 
Laurie Williams 在 本 书 的 第 17 草 中 对 于 结对 编程 法 在 实际 工作 中 的 效 末 进行 了 探索 , 而 结 末 显示 ， 
结对 编程 法 增加 了 在 校生 们 的 效率 和 对 自己 能 力 的 信心 ”。 由 于 可 以 集思广益 和 交换 意见 ， 还 可 
以 在 实在 疲惫 的 时 候 将 问题 交 给 对 方 来 解决 , 所 以 结对 编程 的 参与 者 们 通常 都 不 会 感到 那么 大 的 
压力 ， 也 不 那么 容易 烦躁 。 结 对 编程 还 可 以 让 学 生 们 相互 熟悉 ， 相 互 间 还 可 以 自由 地 提问 题 。 

不 过 ， 结 对 编程 并 没有 解决 组 织 结构 上 的 问题 。 结 对 编程 中 的 两 个 人 通常 经 验 和 背景 相同 ， 
而 且 又 都 是 为 了 得 到 好 的 成 绩 而 盏 斗 。 与 软件 行 新 人 的 情况 对 比 一 下 ,就 会 发 现 。 和 学 校 的 情况 
相似 的 是 ， 在 公司 中 会 有 领导 对 于 新 人 的 表现 进行 评估 ， 而且 和 大 学 教授 一 样 ， 领 导 也 会 先 给 新 
人 足够 的 时 间 来 学 习 知 识 技 能 ， 然 后 再 严格 打分 。 但 是 和 大 学 环境 不 同 的 是 ,应届 毕 业 生 们 在 初 
入 职场 的 时 候 并 不 真正 清楚 他 所 在 的 团队 有 哪些 人 , 也 不 知道 团队 中 谁 最 擅长 什么 , 而 且 自 己 还 
古 整 个 团队 资历 最 浅 的 人 。 























26.6.2 ”合理 的 边际 参与 





大 学 教育 普遍 有 一 个 问题 ， 那 就 是 和 现实 生活 的 脱 广 。 由 于 行业 的 发 展 比 起 教育 要 快 很 多 ， 
所 以 这 种 脱 市 性 也 就 一 直 存 在 着 。Mark Guzadial 提 出 的 多 媒体 编程 教学 法 (Media Computation) 
正 是 为 了 改善 这 个 问题 “， 让 学 生 们 知道 他 们 应 该 在 实践 中 学 习 。 

此 外 , Lave 和 Wenger 在 他 们 的 书 中 也 有 过 相关 讨论 , 并 提出 用 拜师 的 方法 来 让 他 们 参与 到 实 
践 团 体 中 来 进行 实践 和 学 习 。 合 理 边际 参与 法 的 知识 传播 过 程 是 这 样 的 : 新 手 们 观察 有 经 验 的 
人 进行 茶 个 步骤 ,并 随后 在 他 们 的 指导 下 答 试 进行 相同 的 步骤 ,熟悉 之 后 再 去 指导 其 他 人 。Guzdial 
和 Tew 在 他 们 的 多 妹 体 编程 教学 法 的 课程 中 发 现 ， 学 生 们 的 退学 率 降 低 了 。 即 便 是 在 计算 机 科学 
课程 中 更 容易 打 退 管 鼓 的 女性 学 生 的 退学 比率 也 降低 了 。 这 个 课程 还 改变 了 对 于 真实 工作 的 一 些 
背 误 猜测 ， 让 他 们 结合 行业 中 的 实践 进行 学 习 ， 使 他 们 能 更 好 地 适应 将 来 的 工作 。 这 样 的 改变 大 
大 地 增强 了 新 手 们 对 于 自己 能 力 的 信心 ， 也 让 他 们 更 愿意 留 在 实践 团体 再 帮助 其 他 人 。 

Hazzan 和 Tomayko 在 他 们 的 “软件 工程 中 人 的 因素 ”课程 中 ， 详 细 地 模拟 了 在 软件 开发 团队 
中 的 社会 动态 。 他 们 的 软件 工程 课程 教授 的 内 容 包括 : 如 何 处 理 在 团队 中 会 遇 到 的 各 种 难 办 的 社 
交 间 题 、 职 业 道 德 、 在 工作 中 学 习 的 方法 和 技巧 、 怎 么 来 理解 员工 奖励 制度 、 以 及 影响 团队 表现 
和 凝聚 力 的 价值 观 等 。 











26.6.3 ”导师 制 


关于 职场 新 人 社会 化 的 研究 显示 , 新 人 要 成 功 的 话 , 由 有 经 验 的 导师 来 进行 指导 非常 重要 “。 
导师 可 以 癌 目 己 周围 的 人 介绍 新 人 并 帮 新 人 找到 可 以 回答 问题 的 人 ， 还 可 以 在 需要 时 提供 帮助 。 


®© community of practice， 即 由 一 群 人 通过 共同 的 兴趣 、 爱 好 或 者 技术 组 成 的 团体 。 一 一 译 者 注 
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此 外 ， PUT ae lal AST ZAZA EE, APB A, FPA 28 
FAH T. EE, SUM AC AVE ALS FR AR SS TEL a A BARR. 

对 于 我 们 的 研究 对 象 中 的 两 位 来 说 , FE Se Sa ee, 他 们 是 在 同一 时 间 加 
入 的 微软 的 朋友 。 每 当 他 们 学 到 新 的 东西 的 时 候 ， 就 相互 分 享 。 这 样 的 学 习 方 法 比 从 导师 或 者 领 
导 传 授 更 加 有 效 。 由 于 相互 指导 的 两 个 人 通 稍 都 拥有 同样 的 经 验 水 平 ， 使 得 他 们 相互 之 同 更 愿意 
交换 信息 和 知识 ,而 不 用 担心 问 太 基础 的 问题 会 让 人 筑 得 目 己 能 力 不 足 。 很 多 大 学 用 寻 师 制 来 贸 
住 为 数 不 多 的 女性 学 生 和 比例 更 低 的 少数 族 畜 的 学 生 ""。 导 师 在 进行 指导 的 时 候 会 和 学 徒 产生 
文化 和 价值 观 上 的 联系 ， 这 些 在 日 党 工作 中 可 能 不 会 出 现 的 联系 可 以 使 学 什 对 于 团队 更 有 归属 
感 。 这 也 会 帮助 新 人 们 从 社会 网 络 的 边 绿 朝 中 心 移动 。 


26.7 ”改变 的 意义 


我 们 发 现 新 手 们 的 很 多 问题 都 有 着 相同 的 根源 ,， 那 就 是 询 通 的 不 顺畅 以 及 社交 上 的 稚嫩 。 根 
据 我 们 对 职场 新 人 社会 化 的 观察 ， 我 们 提议 对 企业 的 “上 船 ” 《微软 将 新 人 培训 称 作 “上 船 ” 培 
训 ) 和 大 学 计算 机 科学 的 课程 做 一 些 改变 。 我 们 相信 这 些 改 变 可 以 让 应 届 和 毕业 生 们 更 好 地 准备 将 
来 的 工作 ， 并 和 希望 能 够 帮助 他 们 更 快 地 成 长 为 专业 人 土 。 








26.7.1 新 人 培训 


很 多 新 人 在 加 入 微软 几 个 月 之 后 就 有 了 导师 , 而 我 们 也 相信 在 新 人 进 公 司 的 头 一 个 月 进行 集 
中 指导 可 以 达到 最 好 效果 。 一 个 好 的 导师 并 不 只 是 简单 地 跟 新 人 介绍 文档 、 工具 、 流程 、 队员 等 ， 
而 是 以 身 作 则 , 亲 喘 为 新 人 展示 正确 的 行为 和 方法 。 例 如 , Vadim 有 一 天 找到 了 他 的 一 个 队友 (iii 
便 一 提 ， 这 个 并 不 是 他 的 正式 导师 ) ， 问 一 个 关于 重 现 bug 的 问题 。 这 个 队友 是 这 样 做 导师 的 : 他 
和 Vadim 一 起 看 了 bug 报 告 ， 并 发 现 这 个 报告 写 得 含糊 不 请 ， 造 成 了 Vadim 的 问题 。 然 后 他 们 一 起 
从 报告 中 找到 了 写 报 告 的 人 ， 然 后 又 一 起 写 了 一 封 Email 来 询问 这 个 报告 的 详细 情况 。 后 来 他 从 
公司 的 通讯 录 中 发 现 这 个 人 正好 在 这 栋 楼 ， 便 问 Vadim 是 否 想 直接 去 找 这 个 人 。 这 种 以 喘 作 则 的 
做 法 可 以 让 新 人 们 感同身受 地 明白 微软 的 工作 规范 , 如 有 末 仅 仅 只 是 告诉 他 们 怎么 做 的 话 则 不 可 能 
达到 同样 的 效 末 。 与 此 相反 的 是 ，Vadim 的 正式 导师 动 很 全 ， 没 能 帮 上 什么 忙 。 他 经 稍 只 是 告诉 
Vadim 某 某 东 西 或 者 某 革 文档 在 什么 地 方 一 一 而 且 有 时 候 还 会 和 弄 错 。 

我 们 既然 培训 管理 人 员 和 导师 ,并 给 他 们 时 间 提 升 效 率 和 积极 性 ， 那 也 应 该 给 新 的 开发 人 员 
同样 的 机 会 。 帮 助 新 人 们 找到 和 他 们 资历 差不多 的 人 并 让 他 们 可 以 相互 问 问题 (例如 每 个 团队 一 
个 新 人 邮件 列表 或 者 新 人 聊天 室 )， 可 以 使 新 人 的 焦虑 水 平 降 低 ， 并 可 以 在 他 们 中 间 形 成 一 个 新 
人 人 团体， 使 他 们 可 以 相互 询问 和 回答 一 些 一 般 人 看 来 大 “愚蠢 ”的 问题 。 一 个 类 似 的 做 法 是 用 有 
一 点 经 验 的 新 人 来 指导 完全 设 经 验 的 新 人 。 他 们 都 是 新 人 ， 所 以 对 于 工作 前 景 的 认识 都 差不多 ， 
而 且 刚 刚 经 历 过 适应 阶段 的 新 人 导师 们 更 能 掌握 如 何 来 指导 新 人 , 这 些 是 那些 有 经 验 的 老 员工 们 
做 不 到 的 。 

认识 团队 成 员 以 及 了 解 他 们 在 项 目 中 的 位 置 这 样 一 件 重要 的 事情 却 常 常 是 由 新 人 们 自己 默 
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上 默 完成 的 。 我 们 提倡 使 用 “功能 面谈 会 ”的 形式 把 这 个 流程 摊 到 台面 上 来 。 新 人 每 周 预约 一 个 不 
同 的 开发 人 员 进 行 一 次 面谈 ， 从 而 得 知 这 个 开发 人 员 人 负 贡 的 功能 及 其 整体 架构 、 在 整个 系统 之 间 
所 处 的 位 置 、 议 计 上 遇 到 的 困难 , 还 有 这 个 开发 人 员 的 工作 理念 以 及 他 认为 他 工作 中 有 意义 的 东 
西 ， 等 等 。 这 样 的 面谈 会 可 以 让 新 人 们 慢 慢 地 从 软件 开发 人 员 的 角度 (而 不 是 从 死板 的 文档 的 角 
E) 来 解读 这 个 软件 系统 ， 也 让 他 们 有 时 间 来 消化 所 了 解 到 的 信息 。 同 时 ， 面 谈 会 还 可 以 使 得 办 
公 场 所 的 价值 观 和 文化 得 到 更 好 地 推广 ， 让 新 人 们 知道 团队 推崇 什么 价值 观 ， 排 不 什么 价值 观 。 

那么 ,领导 们 如 何 来 衡量 新 人 的 表现 呢 ? 他 们 不 会 像 有 经 验 的 开发 者 那样 高 效 ,而 且 学 习 也 
征 他 们 发 展 的 重要 组 成 部 分 。 我 们 认为 ， 要 衡量 新 人 的 表现 必须 要 看 学 习 的 时 间 、 征 否 敢 于 答 试 
以 及 和 他 人 合作 的 情况 。 此 外 ,我 们 也 应 该 衡量 新 人 导师 的 表现 (例如 可 以 看 新 人 古 否 能 迅速 跟 
上 团队 步伐 ) ， 而 不 是 把 对 新 人 的 塔 训 当 作 征 一 个 无 关 紧 要 也 不 会 被 打分 的 事情 。 我 们 采访 到 的 
许多 新 人 提 到 , 他 们 应 该 在 进入 公司 最 初 的 几 个 月 只 对 系统 进行 多 方面 有 座 度 的 学 习 ， 而 不 征 一 
开始 就 马上 像 一 个 老 员工 一 样 进 项 目 工 作 。 他 们 说 ,一 开始 领导 并 没有 要 求 他 们 要 有 多 高 效 , 但 
是 慢 慢 地 他 们 就 必须 使 用 很 多 时 间 在 “实事 ”上 面 而 没 办 法 伦 时 间 进 行 学 习 了 。 我们 正在 设计 一 
套 给 团队 和 导师 们 使 用 的 评测 准则 。 准 则 将 列 出 个 人 发 展 的 一 些 成 就 ,如 实现 第 一 个 功能 、 审 核 
别人 的 代码 、 被 指派 修复 一 个 bug、 所 写 第 一 个 bug 报告 等 。 每 个 步骤 都 可 以 写 下 来 ， 最 后 组 成 一 
个 “课程 表 "， 其 中 的 每 一 个 步 始 我 们 都 可 以 进行 监督 。 这 些 监督 数据 可 以 让 公司 用 来 评测 对 入 
只 培训 的 改 恨 ， 看 看 改 民 能 个 有 效 改 善 现 状 。 

个 人 软件 流程 (Personal Software Process) 可 以 用 来 帮助 新 手 认 请 他 们 的 任务 完成 情况 ， 并 
生成 可 以 和 导师 、 领导 、 同事 分 享 的 数据 , 以 便 及 早 发 现 新 手 在 流程 上 的 错误 和 说 明 可 能 的 改进 。 
公司 应 该 玛 励 狐 人 多 思 浪 下 一 步 该 做 什么 ,什么 时 候 应 该 找 人 人 帮忙， 是 不 古 在 困 住 了 ， 等 等 。" 
以 使 用 智能 教学 系统 中 监察 成 绩 的 方法 来 帮助 我 们 更 直观 地 认识 开发 人 员 的 行为 , 并 在 新 手 们 应 
该 找 人 帮忙 的 时 候 告 诉 他 们 。 


26.7.2 ”学 校 教 育 


在 很 多 大 学 中 , 新 型 的 软件 毕业 设计 课程 (capstone courses) 让 学 生 可 以 接触 到 完整 的 设计 、 
实现 和 测试 流程 ,并 让 学 生 在 大 学 环境 中 学 习 如 何 与 多 人 团队 一 起 开发 较 大 型 的 软件 。 学 生 们 会 
担当 各 种 角色 ， 比 如 需求 工程 师 、 开 发 人 员 、 测 试 人 员 、 文 档 管 理 等 ， 并 协同 合作 ， 最 后 癌 客 户 
交付 软件 。 通常 学 生 们 是 不 分 等 级 的 ， 团队 的 实际 领导 者 是 教学 助理 或 者 课程 讲师 。 但 是 我 们 的 
研究 显示 , 现实 的 工作 环境 和 新 型 课程 所 提供 的 人 为 的 环境 有 相当 大 的 不 同 。 我 们 发 现 的 很 多 社 
交 和 沟通 方面 的 问题 (尤其 是 在 Xavier 和 Wallace 两 人 身上 ) 的 根源 在 于 工作 在 基于 老 代码 的 大 型 
团队 中 开发 大 型 软件 时 的 焦虑 。 还 有 作为 资历 最 浅 的 团队 成 员 所 造成 的 焦虑 , 可 能 会 让 人 产生 “ 必 
须要 让 别人 知道 我 很 行 ” 的 想法 。 以 及 对 代码 完全 不 了 解 所 造成 的 忧虑 让 人 觉得 需要 “浪费 时 间 ” 
来 学 习 代 码 。 当 花 太 多 时 间 来 解决 问题 的 时 候 也 会 造成 新 手 们 的 焦虑 。 虽 然 也 有 教授 团队 合作 的 
课程 ， 但 这 些 课程 通常 不 会 解决 这 些 焦 虑 问题 。 

比 新 型 的 课程 更 有 建设 性 的 做 法 , 是 提供 给 学 生 们 一 个 现 有 的 代码 库 ， 并 要 求 他 们 修改 〈 真 
实 或 者 故意 造成 的 ) bug 和 编写 新 功能 。 如 果 再 加 上 管理 的 因素 那 就 更 好 了 ， 比 如 学 生 们 必须 和 
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更 有 经 验 的 “同事 ”( 即 之 前 参加 过 这 个 课程 的 学 生 ， 还 可 以 作为 导师 ) 和 “项 目 经 理 ”( 教 学 助 
BE) 来 互动 。 同事 和 “项目 经 理 ” 可 以 帮 他 们 了 解 学 习 代 码 库 ， 还 可 以 要 求 他 们 反复 解决 bug 
直到 找到 “正确 ”的 解决 方案 。 在 开发 过 程 中 , 学 生 可 能 被 要 求 在 bug 数 据 库 中 记录 所 找到 的 bug、 
摸索 出 bug 重 现 方法 ， 还 可 以 根据 某 个 版 本 发 布 计划 来 确定 各 个 bug 的 修复 优先 级 。 

在 大 型 软件 项 目 中 , 修复 bug 不 只 是 修改 代码 。 对 于 一 个 bug 来 说 ,修复 的 方法 很 多 ,每 个 方 
法 都 必须 先 通 过 一 次 人 的 检验 ,再 通过 一 次 技术 检验 。 可 以 试想 ; 这 个 修复 的 规模 有 多 大 ? ED 
到 多 少 行 代码 ?从 寂 到 的 代码 越 多 ， 产 生 新 bug 的 几率 就 越 大 。 这 个 修复 需 不 需要 改动 在 这 个 阶 
段 已 经 封存 的 代码 ?如 果 是 这 样 ,， 那 就 男 找 不 用 动用 已 封存 代码 的 解决 方案 。 与 其 根据 学 生 修 复 
了 多 少 个 bug 来 打分 ,不 如 让 他 们 只 修复 和 报告 他 们 认为 最 重要 的 那 25% 的 bug， 并 让 他 们 说 明 这 
样 做 的 原因 。 

老师 们 应 该 在 课程 中 花 时 间 让 学 生 学 会 元 认 知 技能 。 你 怎么 知道 你 没 走 错 路 ? 当 你 问 同事 问 
题 或 者 需要 告诉 他 们 发 生 了 什么 的 时 候 ， 应 该 如 何 组 织 你 的 语言 ? 你 如 何 与 老师 (或 者 导师 ) 更 
加 有 效 地 互动 ? 当 教 你 的 人 《有 可 能 是 你 的 领导 ) 完全 没有 当 老 师 的 潜质 的 时 候 , 你 如 何 学 习 ? 
如 琳 黎 握 这 些 搁 巧 , 学 生 将 可 以 成 为 更 好 的 同伴 导师 , 帮助 周围 的 软件 工程 师 们 更 好 地 适应 未 来 
的 职位 。 
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第 27 章 


控 据 你 目 己 的 证 所 


Kim Sebastian Herzig 
Andreas Zeller 


在 这 本 书 中 ， 有 很 多 收集 证 据 的 例子 ， 如 证 明 测 试 效率 的 证 据 ， 说 明 bug 报 告 质 量 的 证 据 以 
及 复杂 度 度量 的 作用 的 证 据 , 等 等 。 但 是 如 何 将 这 些 证 据 和 绪论 应 用 到 你 的 项 目 呢 ? 要 知道 这 个 ， 
最 直接 的 办 法 就 是 在 你 的 环境 中 用 你 的 数据 重复 适合 你 情况 的 研究 。 这 样 的 话 ， 你 不 但 可 以 加 次 
对 你 目 己 项 目的 认识 ， 还 可 以 享受 到 做 实验 的 乐趣 。 不 过 ， 你 也 可 能 遇 到 不 好 的 一 面 ， 那 束 是 实 
证 研究 的 成 本 可 能 会 很 高 ， 尤 其 是 当 需 要 对 开发 人 员 进 行 实 验 的 时 候 。 

好 在 我 们 还 有 一 个 相对 来 说 花费 少 一 些 的 方法 来 批量 收集 证 据 。 软 件 的 档案 (如 不 同 的 版 本 
或 者 bug 数 据 库 ) 记录 了 很 多 你 的 产品 的 相关 事务 ， 例 如 产生 的 问题 、 做 了 哪些 修改 以 及 解决 了 
的 问题 。 只 要 对 这 些 档 案 进 行 目 动 数 据 挖 气 ， 你 就 可 以 获取 关于 你 产品 很 多 的 第 一 手 证 据 。 这 些 
数据 不 但 本 映 很 有 价值 ， 而 且 还 可 以 作为 基础 ， 让 我 们 可 以 进行 更 深入 地 试验 ,进而 得 到 更 深入 
的 认识 。 在 这 一 革 中 ,我 们 将 手把手 地 交 给 大 家 如 何 对 软件 档案 进行 数据 挖 据 ， 包括 最 基本 的 技 
术 方 法 以 及 在 数据 挖掘 过 程 中 可 能 会 遇 到 的 陷阱 。 


27.1 对 什么 进行 数据 挖掘 


在 软件 开发 中 , 程序 员 们 定期 性 地 产生 和 收集 各 种 数据 ， 可 以 用 来 进行 目 动 化 分 析 。 这 些 数 
据 包 括 如 下 几 项 。 

O 产品 的 源 代 码 。 这 是 你 需要 分 析 的 最 重要 的 数据 ， 因 为 它 提 供 了 各 种 具体 位 置 (文件 、 
单位 、 类 、 组 件 每 )， 可 以 用 来 把 产品 和 流程 的 各 种 因素 联系 起 来 。 

O 收集 软件 运行 的 相关 数据 ( 即 运行 情况 概略 )， 可 以 让 你 知道 哪些 部 分 古 第 用 的 ， 哪 些 部 
分 不 第 用 。 

O 你 的 产品 可 能 还 包括 额外 的 文档 ， 比 如 设计 文档 或 者 需求 文档 ， 而 这 些 文档 也 许可 以 解 
释 代 码 为 什么 会 古 现在 的 样子 。 

O 我 们 还 可 以 对 程序 进行 神态 分 析 ， 以 得 出 复杂 度 或 者 依赖 关系 。 

O 版 本 档案 库 记 录 了 对 产品 做 过 的 修改 ， 包 括 谁 、 什 么 时 候 、 改 了 什么 地 方 以 及 为 什么 这 
样 修改 。 如 采 档 案 库 中 的 修改 有 清楚 的 分 类 ， 而 我 们 又 能 系统 地 分 析 利 用 这 些 修 改 所 对 
































386 第 27 章 ， 挖 握 你 自己 的 证 据 


应 的 修改 原因 (rationale) ， 那 么 我 们 就 可 以 从 版 本 档案 库 中 了 解 到 项 目的 很 多 历史 情况 。 
O 要 想 将 问题 对 应 到 位 置 ， 那 么 有 一 个 问题 数据 库 就 很 重要 ， 这 个 数据 库 会 记录 所 有 发 生 
过 的 问题 ， 以 及 这 些 同 题 从 发 现 到 解决 的 整个 生命 周期 。 
D 最 后 ， 你 可 能 有 一 些 社会 学 上 的 数据 : 开发 人 员 的 小 组 或 者 团队 间 的 划分 、 开 发 人 员 之 
间 的 Email 或 者 其 他 通讯 ， 莫 至 是 开发 人 员 的 收入 情况 或 者 工作 量 的 相关 数据 。 有 了 这 些 
数据 ， 你 就 能 知道 每 个 人 在 系统 的 各 个 部 分 或 者 任务 上 耗费 了 多 少 精力 ， 或 者 每 个 团队 
做 了 多 少 修改 ， 犯 了 多 少 钮 误 。 不 过 ， 在 你 将 这 些 团队 按照 鱼 误 的 多 少 来 排名 之 前 ， 请 
记 住 ， 任 务 越 难 ， 错 误 就 越 多 。 经 第 出 错 有 可 能 只 是 因为 做 的 是 最 难 的 工作 一 一 而 最 难 
的 工作 通常 古 由 最 有 经 验 和 最 可 靠 的 程序 员 来 担当 有 的 。 
从 研究 者 的 角度 来 看 , 这 些 数 据 的 优势 在 于 它们 不 偏 不 全 一 这 些 数据 客观 地 记录 了 各 种 更 
改 、 问 题 以 及 相关 的 信息 ， 并 真实 地 反映 了 开发 人 员 在 处 理 这 些 回 题 时 所 做 的 各 种 事情 。 不 过 从 
另 一 方面 来 看 , 这 些 数据 也 有 可 能 是 杂乱 和 不 完整 的 ， 所 以 我 们 需要 在 分 析 它 们 之 前 进行 一 些 特 
殊 步 又 。 


27.2 ”设计 你 的 研究 


一 旦 你 确定 了 想 要 的 数据 ， 你 就 必须 选择 一 种 方法 (或 者 制 i 一 个 计划 ) 来 进行 你 的 研究 。 
本 书 已 经 包含 了 很 多 成 功 的 研究 方法 以 及 如 何 进 行 调查 的 一 些 技巧 。 

不 过 , 在 这 里 我 们 有 一 个 忠告 。 虽 然 很 多 数据 挖掘 和 研究 项 目的 理念 都 大 同 小 异 ,， 但 是 如 采 
这 种 “小 异 ” 太 多 的 话 ， 也 会 使 你 的 研究 工作 走 进 死 胡同 。 这 种 “小 异 ” 的 因素 包括 项 目的 性 质 ， 
以 及 项 目 所 使 用 的 开发 流程 。 一 个 很 好 的 例子 古 开源 软件 (如 Eclipse) 和 商业 软件 (如 微软 或 者 
SAP) 的 项 目 之 间 的 区 别 。 各 个 软件 项 目 在 工作 环境 以 及 组 织 环 境 上 的 差异 ， 会 使 得 它们 的 开发 
流程 庆生 根本 性 的 不 同 。 比 如 ,在 开源 项 目 中 开发 人 员 第 第 来 日 世界 各 地 ,而 且 大 多 在 不 同 的 地 
扎 进 行 开 发 。 在 这 种 情况 下 ， 结 对 编程 或 者 集体 审阅 代码 就 变 得 很 困难 ， 甚 至 不 可 能 了 。 即 使 只 
是 想 要 简单 地 就 一 个 问题 谈 一 谈 ， 也 必须 有 人 先进 科技 的 支持 ， 而 且 还 必须 考虑 时 区 的 因素 。 

开发 环境 和 流程 的 不 同 会 给 项 目的 历史 造成 巨大 的 影 啊 , 所 以 我 们 在 对 项 目的 历史 做 数据 挖 
HAJR, 必须 将 这 些 因素 沽 虑 进来 。 从 最 近 的 一 些 研究 对 开源 以 及 商业 项 目 进 行 的 数据 挖 据 来 
看 , 两 种 项 目 各 有 与 之 对 应 的 方法 ““。 很 多 与 流程 相关 的 度量 法 (如 社会 -技术 网 络 度量 法 ””) 
以 及 组 织 结构 类 的 度量 法 的 结果 都 在 很 大 程度 上 取决 于 实际 采用 的 开发 流程 。 即便 是 对 于 同一 
球 开 源 软 件 ， 这 些 度量 法 产生 的 结 末 都 大 不 相同 。 

所 以 我 们 建议 , 在 你 设计 你 自己 的 研究 之 前 , 你 应 该 试 试 在 你 的 项 目 中 复制 一 个 已 经 证 明 有 
效 的 研究 。 如 采 你 最 后 的 结 未 和 原来 的 研究 一 致 或 者 更 好 ， 那 么 就 疫 问 题 。 但 是 如 采 你 的 结 朱 不 
同 , 那 就 需要 调查 一 下 是 什么 造成 了 这 种 区 别 , 因为 在 你 设计 目 己 的 研究 的 时 候 也 需要 认真 考虑 
这 种 区 别 。 



































® Socio-technical network metrics， 人 简单 的 说 就 是 一 种 将 软件 开发 中 人 的 因素 和 软件 系统 的 因素 结合 起 来 (形成 一 个 
网 络 )， 用 于 预测 下 一 版 本 中 最 有 可 能 出 错 的 组 件 的 度量 法 。 一 一 译 者 注 
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现在 我 们 来 介绍 一 下 如 何 得 到 真实 的 历史 数据 。 每 个 软件 仓库 都 古 不 同 的 , 所 以 挖掘 有 关 数 
据 的 步骤 也 征 不 同 的 。 但 是 大 部 分 数据 挖掘 工具 的 使 用 方法 都 差不多 。 我 们 将 在 这 一 贡 用 一 个 真 
实 的 例子 ，IBM Eclipse 项 目 ， 来 逐步 展示 如 何 对 一 个 软件 仓库 进行 数据 挖掘 。Eclipse 征 一 个 开源 
软件 ， 而 且 长 期 以 来 一 直 古 很 多 软件 工程 研究 项 目的 研究 对 象 。 

因此 ， 用 Eclipse 来 作为 例子 非常 合适 。 虽 然 天 于 bug 及 其 修复 的 数据 都 是 公开 的 ， 但 是 却 并 
不 征用 系统 的 方法 来 收集 的 ， 这 将 让 我 们 的 研究 很 有 趣 ， 也 很 具 挑 成 性 。 

历史 数据 以 多 种 形式 存在 于 不 同 的 软件 项 目 之 中 , 如 版 本 控制 、bug 跟 踊 系 统 、Email 通 信 等。 
为 了 从 软件 项 目的 历史 中 提取 数据 并 从 中 学 习 经 验 教训 ,我 们 必须 得 访问 这 些 资 源 。 对 于 很 多 开 
源 软件 (如 Eclipse) 来 说 ， 这 些 资源 中 的 大 部 分 都 是 辣 公 众 开 放 的 ， 而 且 可 以 随意 查看 。 

接 下 来 我 们 将 详细 地 展示 各 个 步 又 ， 即 如 何 一 步 一 步 地 提取 Eclipse 的 历史 、 流 程 和 bug 数 据 ， 
以 用 于 缺陷 预测 或 者 流程 分 析 。 一 般 来 说 , 这些 数 据 将 被 储存 在 永久 性 数据 储存 系统 (如 关系 数 
据 库 ) 中 ,使 我 们 可 以 做 更 深入 的 分 析 和 检查 。 最 后 ,我们 将 能 得 到 一 系列 的 数据 ， 而 这 些 数据 
将 告诉 我 们 代码 中 的 哪些 修改 市 来 了 新 的 bug, 还 可 以 让 我 们 知道 一 共 修 复 了 多 少 bug 以 及 十 在 哪 
个 文件 中 修改 的 。 


27.3.1 第 一 步 : 确定 要 用 哪些 数据 


Eclipse 在 其 版 本 控制 系统 (CVS) 和 bug 跟 踪 系 统 (Bugzilla) 中 储存 了 很 多 关于 故障 及 补丁 
的 信息 。 还 有 很 多 信息 可 能 都 被 状 没 在 Email 存档 里 了 ， 但 是 这 种 信息 坚 无 结构 可 言 ， 无 法 用 于 
统计 分 析 。 不 过 我 们 即将 看 到 ， 即 便 只 是 对 版 本 控制 系统 和 bug 跟 踩 系 统 的 数据 进行 挖掘 ， 也 还 
是 有 很 多 困难 。 

在 我 们 这 个 Eclipse 的 例子 中 ， 我 们 将 产 代 码 的 变更 历史 以 及 bug 报 告 保存 在 一 个 MySQL 数 据 
库 里 面 。 也 就 是 说 ， 我 们 必须 确定 从 这 些 资源 中 找到 的 信息 有 哪些 是 和 我 们 的 研究 目的 相关 的 ， 
还 必须 确定 如 何 来 将 两 个 系统 中 的 信息 联系 起 来 。 我 们 的 目标 是 找 出 对 源 代 码 做 出 的 哪些 修改 导 
致 了 bug， 并 找 出 对 应 的 源 文件 。 为 此 ， 我 们 需要 所 有 人 能够 得 到 的 源 代 码 操 作 记 录 (尤其 是 提交 
AE) 以 及 bug 报 告 ， 用 于 帮助 我 们 确定 两 点 : 第 一 ， 在 哪 一 次 操作 的 时 候 这 个 bug 被 修复 了 ; 第 
本， 修改 了 哪些 文件 。 图 27-1 展 示 了 一 个 数据 库 表 的 例子 ， 这 样 的 结构 允许 我 们 将 代码 的 变更 
(rcs_transaction)、 产 文件 版 本 (rcs_revision) 以 及 bug 报 告 (bts_report) 联系 起 来 。 

要 想 把 bug 对 应 到 文件 ， 我 们 需要 有 一 个 把 bug 报 告 和 源 代码 操作 联系 起 来 的 方法 。 由 于 在 
Eclipse 的 开发 中 ， 两 个 数据 并 不 是 联系 在 一 起 的 (这 一 点 和 新 一 些 的 编程 环境 不 同 ， 如 IBM 的 
Jazz 1， 就 把 bug 报 告 系统 和 版 本 控制 系统 联系 起 来 了 ) ， 我 们 需要 参考 开发 者 的 数据 输入 。 开 发 
人 员 可 以 输入 数据 的 两 个 位 置 分 别 是 提交 信息 (把 修改 提交 到 版 本 控制 系统 时 可 以 附加 的 信息 ) 
以 及 bug 报 告 的 说 明 / 讨 论 。 我 们 必须 从 这 两 个 位 置 中 提取 数据 。 

要 想 把 故障 对 应 到 文件 ， 我 们 必须 跟 踊 在 备 个 操作 中 源 文件 的 变化 。 有 了 这 个 信息 , 再 加 上 
bug 到 操作 记录 的 对 应 ， 我 们 便 能 够 找到 bug 对 应 的 文件 。 
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版 本 数据 库 中 ， 对 于 每 一 批 同 时 提交 上 来 的 代码 变更 ， 都 有 一 个 变更 记录 ( 称 为 操作 记录 ) 
这 些 记录 包括 修改 人 、 修 改 时 间 、 修 改 的 文件 以 及 这 些 文件 修改 的 部 分 ， 再 加 上 一 个 操作 记录 。 
所 以 ， 分析 这 些 记 录 将 使 我 们 得 到 一 直 以 来 在 这 个 项 目 中 发 生 的 代码 变更 的 所 有 历史 信息 。 


rcs file | 





res_revision 


bts_report 






res_transaction 






recs2bts heuristic 








图 27-1 bug、 操 作 和 文件 的 数据 表 结 构 。 箭 头 表示 外 键 (foreign key) 以 及 连接 点 


27.3.2 ”第 二 步 : 获取 数据 


为 了 保证 可 以 不 间断 地 迅速 访问 版 本 控制 系统 和 bug 追 踪 系 统 , 你 应 该 下 载 一 个 副本 到 本 地 。 

Eclipse 的 版 本 控制 系统 有 一 个 已 经 准备 好 的 转 存 包 (dump) 放置 在 其 网 站 上 以 供 下 载 "。 这 
个 转 存 包 可 以 用 来 在 本 地 建立 一 套 完整 的 版 本 控制 系统 ， 包 括 所 有 的 源 代码 文件 以 及 所 有 在 
Eclipse 历史 上 曾经 发 生 过 的 源 代码 修改 。 

不 过 要 把 bug 追 踪 系统 也 做 一 个 本 地 副本 就 要 复杂 一 些 了 。 要 分 析 bug 报 告 ， 我 们 必须 有 一 个 
机 器 可 读 而 且 定义 良好 的 数据 格式 .Bugzilla 符 合 这 个 要 求 。 我 们 可 以 将 单个 bug 导 出 为 XML 文档 。 
要 利用 这 个 功能 需要 用 到 一 个 脚本 ， 然 后 你 便 可 以 将 所 有 bug 以 XML 文档 的 形式 下 载 到 本 地 硬 
盘 ， 再 做 其 他 处 理 。 


Dhttp://archive.eclipse.org/arch/, 


27.3 数据 控 据 入 门 389 


下 面 这 个 Bash 脚 本 将 下 载 ID 为 1 至 300 000 的 bug 报 告 的 XML 文 档 ， 并 保存 至 一 个 临时 目录 : 


for i in {0..300000}; do curl -o /tmp/eclipse_bug_${i}.xml 
"https://bugs.eclipse.or/bugs/show bug.cgi?ctype=xml&id=${1i}"; done 


有 一 点 需要 注意 : 有 一 些 ID 是 无 效 的 ， 因为 有 的 bug 报 告 已 经 删除 , 而 有 的 bug 报 告 仅 供 内 部 
人 员 了 阅读 。 这 意味 着 下 载 下 来 的 XML 文档 中 有 一 些 会 只 包括 一 条 错误 信息 。 在 分 析 报 告 的 时 候 ， 
我 们 需要 记 住 这 一 点 。 


27.3.3 BaD: 数据 转换 (可 选 ) 


数据 挖掘 不 止 需要 你 下 载 和 处 理 数 据 ， 还 需要 你 对 数据 的 特征 预先 有 了 了解。 任何 时 候 ， 当 你 
在 对 一 个 储存 库 进 行 数 据 挖 掘 的 时 候 ， 都 必须 牢记 数据 挖掘 的 目的 : 提取 项 目 和 流程 数据 。 所 以 
你 得 到 的 数据 应 该 符合 你 所 设置 的 前 提 条 件 。 

在 我 们 这 个 案例 中 , Eclipse 的 版 本 系统 和 bug 报 告 系统 中 用 来 作为 基础 的 信息 是 不 同 的 。bug 
报告 包含 的 是 茶 个 bug 修 复 操作 的 全 部 信息 。 而 版 本 控制 系统 则 不 同 ， 它 的 修改 记录 所 对 应 的 古 
源 文件 ， 而 不 是 操作 。 所 以 在 Eclipse 的 这 个 案例 中 ， 将 数据 资源 相互 转换 格式 是 很 有 必要 的 。 为 
IE, 你 应 该 将 CVS 的 数据 转换 为 一 个 以 操作 为 基础 , 而 不 是 以 文件 为 基础 的 格式 ,例如 Subversion 
(CSVN) 。 要 做 这 个 转换 ， 我 们 可 以 使 用 cvs2svn 这 个 工具 "， 它 可 以 保证 数据 不 会 在 转换 过 程 之 中 
ER (包括 GCC、Mozilla、FreeBSD、KDE、GNOME 等 项 目的 CVS 库 都 可 以 用 这 个 工具 来 转换 )。 

下 面 这 条 命令 可 以 把 Eclipse 的 CVS 库 转换 为 SVN 库 : 


cvs2svn -svnrepos path to new svn repo -include-empty-directories -no-prune -no-cross- 
branch-commits -retain-conflict-attic-files --verbose 


注意 根据 CVS 库 的 大 小 ， 转 换 将 需要 一 些 时 间 。 为 了 确保 顺利 完成 转换 过 程 而 不 出 现 错误 ， 
我 们 强烈 建议 在 正式 转换 之 前 ， 先 给 刚才 的 命令 加 上 --dry-run 选项 试 运行 一 次 。 加 上 这 个 选 
项 之 后 ,转换 絮 就 不 会 真 的 转换 数据 ， 而 只 是 模拟 转换 过 程 ， 并 把 实际 转换 中 可 能 击 到 的 问题 告 
诉 你 。 











27.3.4 ”第 四 步 : 提取 数据 


到 此 ， 你 在 本 地 硬盘 上 的 数据 已 经 准备 好 了 ， 并 且 这 些 数 据 也 符合 前 提 条 件 ， 接 下 来 可 以 
开始 理 数据 了。 数据 的 处 理 包 括 提取 、 过 小 以 及 将 这 些 数据 以 人 类 可 读 的 格式 保存 于 永久 性 储 
存 设备 。 

在 这 一 步 我 们 用 版 本 控制 系统 和 bug 数 据 库 中 得 来 的 数据 生成 XML 文档 。 我 们 前 面 分 析 的 ， 
Eclipse 的 版 本 控制 系统 中 包含 的 是 操 作 相 关 的 信息 。 我 们 可 以 使 用 下 面 这 个 SVN 目 带 的 命令 将 这 
些 信息 提 取 为 XML 文 档 : 


svn log -xml --verbose 


@ http://cvs2svn.tigris.org , 
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你 可 以 用 你 喜欢 的 XML 解析 框架 来 解析 这 些 XML 文 档 以 及 在 第 二 步 中 下 载 下 来 的 bug 报 告 ， 
然后 ， 将 解析 出 来 的 数据 存在 数据 库 内 〈 见 图 27-1)。 


27.3.5 ”第 五 步 : 解析 bug 报 告 
下 一 步 是 对 在 第 二 步 中 获取 的 bug 报 告 进行 解析 。 填 好 bts_report 表 的 所 有 字段 是 很 重要 


的 ， 特 别 是 ID、title (标题 )、description (ĦA), creationDate (创建 日 期 )、status 
(状态 ) resolution (解决 方案 ) 和 version 〈 版 本 )。 我 们 可 以 用 这 些 字段 来 把 bug 报告 和 版 
本 控制 操作 记录 联系 起 来 。 


27.3.6 ”第 六 步 : 关联 数据 


我 们 已 经 从 数据 资源 中 提取 了 所 需 的 信息 , 现在 要 做 的 是 把 这 些 数据 相互 对 应 起 来 。 到 目前 
为 止 ， 所 有 数据 都 是 独立 收集 的 ， 没 有 和 其 他 的 数据 进行 相互 关联 。 

要 将 bug 和 操作 对 应 起 来 ， 你 必须 依靠 那些 直接 或 间接 地 包含 了 交叉 参照 (cross-reference) 
音 息 的 用 户 输 入 。 在 我 们 的 Eclipse 案例 里 ， 这 种 数据 可 能 从 两 个 渠道 得 到 。 

O 当 提 交代 码 修改 到 版 本 库 的 时 候 ， 开 发 人 员 直 接 指 出 了 所 修复 bug 的 编号 〈 如 :“ 修 复 了 

bug 88352: 操作 导致 环境 菜单 泄漏 ……”)。 
O 当 关 闭 一 个 bug 报 告 的 时 候 ， 开 发 人 员 提 到 了 修复 这 个 bug 的 操作 记录 ID (如 “修复 了 
Windows 版 的 问题 ，SVN 版 本 6800。 麻 烦 谁 再 检查 一 下 .…… á 

你 必须 在 操作 提交 信息 以 及 bug 报 告 两 者 中 都 搜寻 可 能 的 相互 对 应 关系 。 

就 算 找 到 很 多 错误 的 对 应 关系 也 很 正 第 ， 你 需要 随时 根据 当前 结果 准备 调整 你 的 规则 表达 
Wo 你 可 以 反复 地 进行 搜索 , 然后 亲 目 检查 每 一 次 得 到 的 数据 集中 的 问题 , 用 于 改善 下 一 次 搜索 。 

1. 将 代码 变更 和 bug 报 告 联系 起 来 

我 们 发 现 ， 最 常见 的 情况 是 开发 人 员 把 修复 的 bug ID 写 到 提交 信息 里 面 去 。Fischer 等 人 “以 
及 Cubranic 和 Murphy 是 第 一 批 在 更 改 提交 信息 中 搜寻 bug 数 据 库 的 引用 信息 并 用 这 些 信 息 来 找 
出 CVS 库 和 bug 数 据 库 之 则 联系 的 人 ,此 后 , Sliwerski 等 人 改 民 了 识别 解决 bug 的 代码 修改 的 方法 ， 
这 种 修改 存在 于 已 成 功 解决 了 的 bug 中 “。 依 照 他 们 的 方法 ， 我 们 需要 执行 下 列 步 又 。 

(1) 选择 所 有 包含 可 能 有 修复 bug 意 味 的 关键 词 (如 “修复 ”、“ 问 题 "、“bug”、“ 解 决 ”等 ) 
的 提交 信息 。 这 些 提交 信息 有 可 能 包含 和 bug 数 据 库 交 又 的 参照 信息 。 

(2) 在 这 些 提交 信息 中 用 以 下 规则 表达 式 进 行 搜索 : 

O bug[# \t]*[0-9]+ 

a pr[# \t]*[0-9]+ 

Q show\ bug\.cgi\?id=[0-9]+ or \[[0-9]+\] 

每 个 匹配 结 末 都 有 可 能 和 一 个 bug 相 关 , 不 过 ,这 个 方法 也 有 可 能 给 你 很 多 误 报 , 如 "Updated 























此 表 仅 供 参考 ， 并 不 完善 。 
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copyrights to 2004” 《将 版 权 信息 更 新 到 2004 年 ) 这 样 非 的 bug 信 息 也 会 被 找 出 来 。 此 外 ， 
如 果 想 要 知道 找到 的 bug 报 告 链接 是 否 有 效 , 那么 你 还 必须 检查 链接 那 一 头 的 bug 报 告 信 息 。 由 于 
你 需要 了 解 的 只 是 那些 真正 解决 了 bug 的 代码 修改 记录 , 你 可 以 只 关注 链接 到 下 面 几 种 pug 报 告 的 
记录 : 

D 状态 标记 为 “已 关闭 ”的 ， 

口 解决 情况 标记 为 “已 解决 ”的 ， 

O 解决 日 期 和 更 改 提交 日 期 接近 的 (如 相差 在 5 天 以 内 )。 

还 有 很 多 其 他 的 条 件 可 以 用 来 判断 链接 的 有 效 性 , 但 是 这 些 条 件 通常 和 软件 项 目的 开发 流程 
有 密切 联系 ， 必须 针对 不 同 的 项 目 进行 调整 。 还 有 一 点 需要 记 住 的 是 一 个 操作 所 修改 的 代码 有 可 
能 解决 多 个 bug。 

2. 将 bug 报 告 和 代码 变更 联系 起 来 (可 选 ) 

虽然 用 扫描 提交 信息 来 搜寻 交叉 参照 的 方法 对 于 很 多 项 目 而 言 已 然 够 用 , 但 还 是 有 一 些 项 目 
需要 用 其 他 的 方法 。Cubranic 和 Murphy 是 第 一 批 为 这 些 链接 做 反 向 联系 的 人 (从 Bugzilla 联 系 到 
CVS 库 ) ， 方 法 是 将 bug 相 关 的 行为 和 代码 的 变更 联系 起 来 “。 

如 果 有 需要 ， 我 们 可 以 将 前 一 步骤 中 的 流程 反 转 ， 在 标记 为 “已 关 团 ”和 “已 解决 ”的 bug 
报告 中 搜寻 可 能 的 版 本 ID 和 关键 词 ， 如 “zevision”( 修 正版 本 )、“transaction”( 操 作 )、 
“patch”( 补 丁 ) 等 。 然 后 ， 试 着 将 这 些 ID 和 操作 ID 对 应 起 来 。 和 之 前 相同 ， 我 们 还 需要 过 滤 误 
报 ， 即 删除 在 bug 标 记 为 “已 解决 ”之 后 才 应 用 的 版 本 ID。 同 样 需要 记 住 的 是 ， 一 个 bug 报 告 也 可 
能 联系 到 多 个 操作 。 这 些 操作 中 有 的 可 能 是 早 前 不 完整 的 修复 。 而 其 他 的 操作 可 能 已 经 被 取消 了 。 
所 以 ， 添 加 引用 的 顺序 可 能 也 有 一 定 重 要 性 。 


27.3.0 第 六 步 : 找 出 漏 挥 的 天 联 


在 把 bug 报 告 和 代码 变更 相互 联系 的 时 候 , 你 将 会 发 现 有 一 些 bug 报 告 或 者 代码 变更 一 直 没有 
关联 ， 也 即 是 说 ， 你 并 没 能 找 出 菜 些 bug 是 由 哪 次 操作 修复 的 ， 而 对 于 版 本 控制 库 中 的 某 些 操作 
记录 ,你 也 不 知道 它们 是 为 了 解决 什么 问题 。 这 种 漏 掉 的 关联 是 数据 干扰 (noise) 的 一 种 。 在 数 
据 挖掘 中 是 肯定 会 漏 掉 一 些 关联 的 , 但 是 如 果 不 进 行人 工 筛选 分 类 , 这 个 问题 就 很 难 解决 。 不过， 
有 一 点 要 注意 的 是 ， 漏 掉 的 关联 有 时 并 非 随机 出 现 , 而 是 与 菜 些 干 扰 因 素 有 关 。 例 如 ， 有 经 验 的 
开发 人 员 可 能 会 更 加 自律 地 把 代码 更 改 和 bug 报 告 关 联 起 来 ， 结 果 就 会 造成 我 们 观察 到 的 关联 也 
可 能 只 是 基于 更 有 经 验 的 开发 人 员 的 片面 观点 。 
最 近 ，Bird 等 人 向 我 们 展示 了 这 种 片面 的 数据 所 带 来 的 严重 问题 ， 尤 其 是 在 生成 bag 预测 模 
型 以 及 用 bug 数 据 来 做 假设 实验 的 时 候 趾 。 对 数据 集 进行 人 工 检查 不 能 解决 这 类 问题 ， 但 是 可 以 
用 来 检测 明显 的 数据 偏差 。 








27.3.8 ”第 七 步 : 将 bug 对 应 到 文件 
现在 你 已 经 将 bug 对 应 到 修正 控制 的 操作 了 。 接 下 来 , 需要 把 bug 对 应 到 源 文件 。 幸 好 ， 这 一 
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步 很 简单 。 用 我 们 的 数据 库 结构 ( 见 图 27-1)， 你 可 以 很 容易 地 找 出 哪些 操作 修改 了 哪些 文件 。 
Zimmermann 等 人 使 用 了 一 个 类 似 的 方法 来 计算 每 个 源 文件 所 对 应 的 bug 的 数量 。 

然后 我 们 能 得 到 一 组 数据 ， 记 录 了 每 个 源 文件 中 修复 的 bug 数 量 ， 这 可 以 作为 该 文件 的 质量 
指标 。 这 个 数据 可 以 用 来 和 其 他 的 参数 相关 联 ， 如 文件 修改 的 次 数 或 者 文件 的 代码 复杂 度 等 。 

例如 ， 在 图 27-2 中 展示 的 ， 是 在 Eclipse 3.1 中 用 了 超过 300 行 代码 的 修改 来 修复 的 bug 的 分 布 
情况 ， 这 些 信息 正 是 我 们 用 本 章 中 描述 的 步骤 从 Eclipse 的 库 中 获得 的 ”。 图 中 的 每 个 方块 都 代表 
Eclipse 3.1 版 中 的 一 个 源 文件 ， 来 自 同 一 个 包 的 文件 放 在 一 起 。 方 块 越 大 ， 就 代表 这 个 版 本 中 修 
改 的 行 数 越 多 。 而 方块 越 白 ， 就 代表 这 个 包 在 Eclipse 3.1 版 本 中 需要 修改 的 bug 越 多 。 这 样 的 数据 
市 来 了 很 多 问题 ， 如 : 为 什么 有 些 类 那么 容易 出 错 ? 我 们 可 以 试 着 寻找 弟 见 的 原因 ， 对 将 来 bug 
的 位 置 做 出 预测 并 检查 这 些 预 测 , 便 可 以 得 到 一 些 有 趣 的 见解 。 当 然 , 在 你 自己 的 项 目 中 应 用 这 
些 搁 巧 无 颖 是 最 激动 人 心 的 ， 因 为 所 有 做 判断 所 需 的 数据 已 经 尽 在 向 握 了 。 
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图 27-2 ”Eclipse 包 中 的 更 改 和 bug 分 布 。 方 块 〈 代 表 包 ) 越 大 代表 修改 的 行 数 越 多 ， 
方块 越 白 代表 出 现 的 bug 越 多 


27.4 下 面 怎 么 办 
图 27-2 所 示 的 bug 和 更 改 分 布 情况 本 身 就 有 一 定价 值 ， 你 可 以 直观 地 看 到 被 修改 最 多 的 包 ， 





O 这 个 图 是 用 马里 兰 大 学 开发 的 Treemap 程 序 生 成 的 ，http:/www.cs.umd.edu/hcil/treemap/。 
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还 可 以 看 到 问题 最 多 的 包 。 下 面 要 做 的 ， 就 是 找 出 形成 这 个 分 布 的 原因 。 作 为 一 名 管理 者 ， 你 应 
该 能 解释 bug 和 更 改 为 什么 会 这 样 分 布 ， 尤 其 是 那些 极端 情况 (如 bug 最 多 或 者 更 改 最 多 的 模块 ) 
发 生 的 原因 。 不 过 ,你 可 能 还 是 会 对 某 些 不 那么 极端 的 问题 感到 意外 : 那些 遍及 整个 项 目 ， 并 且 
有 可 能 和 某 些 反复 出 现 的 原因 有 关 的 问题 。 
到 目前 为 止 ， 根据 我 们 的 经 验 来 看 ， 每 个 项 目 中 的 问题 根据 项 目 不 同 而 有 着 不 同 的 与 bug/ 更 
改 相 关 的 成 因 , 这 也 是 我 们 要 对 项 目的 历史 进行 数据 挖掘 的 原因 。 我 们 可 以 从 以 下 几 点 开始 进行 
调查 。 
e 0000000 
通过 分 析 组 件 所 使 用 的 API，Schroter 等 人 指出 ，Eclipse 内 部 编译 器 的 代码 的 出 错 率 是 其 
GUI 组 件 的 7 倍 一 。 这 类 证 据 不 仅 可 以 用 于 确定 你 应 用 程序 的 关键 区 域 ， 还 可 以 在 没有 历史 
数据 的 情况 下 ， 观 窦 组 件 所 使 用 过 的 API 来 预测 新 组 件 的 质量 。 
e 0000000 
RE ARH FES WS h. MATIERE Ae, A aR Pe HE TB AE 
着 变 得 越 来 越 困 难 。 关 于 如 何 定义 代码 的 复杂 度 有 很 多 种 方法 ， 而 且 很 多 研究 显示 ， 代 人 码 的 
复杂 度 确实 可 以 作为 很 好 的 问题 预测 指标 。 
e 0000000 
最 近 修 改 (或 者 有 过 大 量 修改 ) 的 组 件 容 易 产 生 较 多 bug。Hassan 和 Hold 介 绍 了 一 种 故 
障 多 发 模块 缓存 算法 ， 可 以 找 出 最 有 可 能 包含 pug 的 10 个 子 系统 “。 要 构建 这 个 前 10 名 的 名 
单 ， 只 需 使 用 最 频 裳 更改、 最 近 更 收 、 最 频繁 修复 以 及 最 近 修 复 4 种 模块 的 历史 人 信息。 不管 
你 是 管理 者 还 是 开发 人 员 ， 都 可 以 使 用 像 “前 10 排 名 ”这 样 的 办 法 来 确定 哪些 模块 最 容易 
出 问题 ， 然 后 重点 测试 这 些 模块 。 
e 0000000 
组 件 经 历 的 测试 越 多 , 包含 bug 的 可 能 性 就 越 小 。Hutchins 等 人 的 研究 表明 , 高 覆盖 率 ( 超 
过 90%) 的 测试 集 比 随机 选择 的 测试 集 更 容易 检测 出 故障 “。 后 来 在 Nagappan 等 人 的 研究 中 ， 
也 曾 成 功 地 用 覆盖 率 数据 信息 来 建立 故障 预测 模型 中。 也 就 是 说 , 对 你 项 目的 测试 数据 集 和 
系统 的 健康 信息 进行 数据 挖掘， 可 以 帮助 你 检测 代码 中 可 能 存在 问题 ， 但 疝 未 经 过 完整 测试 
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码 的 作者 。 在 微软 ， Nagappan 等 人 做 了 一 个 调查 ， 即 分 布 式 开发 团队 所 开发 的 组 件 是 人 否 比 本 
地 团队 更 容易 出 问题 。 但 令 人 意外 的 是 , 两 者 并 没有 多 大 区 别 。 但 如 Ekanayake 等 人 的 研究 
显示 ， 编 辑 同一 个 文件 的 人 的 数量 和 这 些 人 所 修复 的 缺陷 的 数量 会 影响 故障 预测 的 品质 “。 
结合 这 些 数据 ， 你 会 发 现 一 些 相 关 性 , 但 古 这 些 相关 性 并 不 意味 着 因 琳 关系。 例如 ， 当 我 们 
和 尝试 将 Eclipse 中 的 bug 密 度 和 每 个 开发 人 员 联 系 起 来 的 时 候 ， 我 们 发 现 首 席 染 构 师 Erich Gamma 
居然 征 bug 密 度 最 高 的 人 。 而 我 们 问 Gamma 为 什么 会 这 样 的 时 候 , 他 说 :“ 总 会 有 一 些 问 题 定 你 解 
估 不 了 的 ， 所 以 你 只 能 交 给 你 的 上 级 ,觉得 任 他 的 能 力 应 该 可 以 解决 。 然 后 这 些 问 题 就 这 样 一 步 
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步 传 到 最 上 层 一 一 先 到 组 长 那里 ， 再 到 部 门 总 管 那 里 ， 如 此 这 般 ， 而 且 疫 人 愿意 去 搭理 它们 。 基 
后 这 些 问 题 就 都 跑 到 我 这 儿 来 了 。 我 没 上 级 了 ， 所 以 我 必须 上 自己 去 解决 这 些 问 题 。 实 际 上 ， 我 整 
天 做 的 事情 分 都 很 高 风险 。 
记 住 这 一 点 ,你 就 可 以 开始 挖 抉 数 据 中 的 相关 性 了 ,然后 再 根据 你 的 理论 ,将 这 些 相关 性 整 
anne 不 过 要 注意 的 是 ， 用 这 样 的 方法 得 到 的 证 据 将 会 市 来 更 多 的 问题 ,也 就 需要 更 多 
其 他 的 证 据 来 解决 。 一 套 目 动 挖 据 数 据 的 措施 将 让 你 更 轻松 地 获取 这 些 证 据 ， 并 用 这 些 真实 的 数 
据 来 支持 你 的 判断 。 


27.5 ”致谢 


本 章 中 描述 的 多 种 基本 的 数据 挖掘 技巧 是 和 Peter Weigerber 以 及 Thomas Zimmermann!" 共同 
开创 的 ， 谨 在 此 对 他 们 表示 永恒 的 谢意 。 此 外 ， 感 谢 Yana Mileva, Nadja Altabari 和 Clemens 
Hammacher 在 本 章 初 期 修订 的 时 候 提 供 的 宝贵 意见 


27.6 ”参考 文献 


[1] [Burd et al. 2009a] Bird, C., A. Bachmann, E. Aune, J. Duffy, A. Bernstein, V. Filkov, and P. Devanbu. 2009. 
Fair and Balanced? Bias in Bug-Fix Datasets. Proceedings of the Seventh Joint Meeting of the European 
Software Engineering Conference and the ACM SIGSOFT Symposium on the Foundations of Software 
Engineering: 121-30. 

[2] [Bird et al. 2009b] Bird, C., N. Nagappan, H. Gall, B. Murphy, and P. Devanbu. 2009. Putting it all together: 
Using socio-technical networks to predict failures. Proceedings of the 20th International Symposium on 
Software Reliability Engineering: 109-119. 

[3] [Cubranic and Murphy 2003] Cubranic, D., and G. C. Murphy. 2003. Hipikat: Recommending pertinent 
software development artifacts. Proceedings of the 25th International Conference on Software Engineering: 
408-418. 

[4] [Ekanayake et al. 2009] Ekanayake, J., J. Tappolet, H. Gall, and A. Bernstein. 2009. Tracking concept drift of 
software projects using defect prediction quality. Proceedings of the 2009 6th IEEE International Working 
Conference on Mining Software Repositories: 51-60. 

[5] [Fischer et al. 2003] Fischer, M., M. Pinzger, and H. Gall. 2003. Populating a release history database from 
version control and bug tracking systems. Proceedings of the International Conference on Software 
Maintenance: 23. 

[6] [Frost 2007] Frost, R. 2007. Jazz and the Eclipse Way of Collaboration. JEEE Software 24(6): 114-117. 

[7] [Hassan and Hold 2005] Hassan, A., and R. Hold. 2005. The Top Ten List: Dynamic Fault Prediction. 
Proceedings of the 21st IEEE International Conference on Software Maintenance: 263-272. 

[8] [Hutchins et al. 1994] Hutchins, M., H. Forster, T. Goradia, and T. Ostrand. 1994. Experiments of the 
effectiveness of dataflow- and control flow-based test adequacy criteria. Proceedings of International 


Conference on Software Engineering: 191-200. 


27.6 参考 文献 395 


[9] [Nagappan et al. 2006a] Nagappan, N., T. Ball, and B. Murphy. 2006. Using Historical In-Process and Product 
Metrics for Early Estimation of Software Failures. Proceedings of the 17th International Symposium on 
Software Reliability Engineering: 62-74. 

[10] [Nagappan et al. 2006b] Nagappan, N., T. Ball, and A. Zeller. 2006. Mining metrics to predict component 
failures. Proceedings of the 28th International Conference on Software Engineering: 452-461. 

[11] [Nagappan et al. 2008] Nagappan, N., B. Murphy, and V. Basili. 2008. The influence of organizational structure 
on software quality: An empirical case study. Proceedings of the 30th International Conference on Software 
Engineering: 521-530. 

[12] [Schroter et al. 2006] Schroter, A., T. Zimmermann, and Andreas Zeller. 2006. Predicting component failures at 
design time. Proceedings of the 2006 ACM/IEEE International Symposium on Empirical Software Engineering: 
18-27. 

[13] [Sliwerski et al. 2005] Sliwerski, J., T. Zimmermann, and A. Zeller. 2005. When do changes induce fixes? 
Proceedings of the 2005 International Workshop on Mining Software Repositories: 1-5. 

[14] [Zimmermann et al. 2004] Zimmermann, T., and P. WeiBgerber. 2004. Preprocessing CVS Data for 
Fine-Grained Analysis. Proceedings of the First International Workshop on Mining Software Repositories: 2-6. 

[15] [Zimmermann et al. 2007] Zimmermann, T., R. Premraj, and A. Zeller. 2007. Predicting defects for Eclipse. 
Proceedings of the Third International Workshop on Predictor Models in Software Engineering: 9. 

[16] [Zimmerman et al. 2009] Zimmermann, T., N. Nagappan, H. Gall, E. Giger, and B. Murphy. 2009. 
Cross-project defect prediction: A large scale experiment on data vs. domain vs. process. Proceedings of the 7th 
joint meeting of the European software engineering conference and the ACM SIGSOFT symposium on the 
foundations of software engineering: 91-100. 





第 28 章 
正当 使 用 “复制 -粘贴 ”大 法 


Michael Godfrey 
Cory Kapser 


<Ctrl-C>，<Ctrl-V>， 虽 然 每 个 软件 开发 人 员 都 知道 “复制 -粘贴 ”大 法 《又 叫 代码 克隆 ) ze 
个 坏 习 惯 , 但 每 个 人 又 帮会 这 样 做 。 我 们 有 时 可 能 会 因为 这 种 偷懒 的 行为 而 完 得 难受 , 但 古 了 最 后 
却 还 是 对 上 自己 说 这 些 都 是 编程 的 需要 嘛 ,然后 继续 复制 粘贴 。 毕 苋 在 大 部 分 情况 下 ， 先 复制 粘贴 
一 段 差 不 多 功能 的 代码 ， 再 慢 慢 修改 成 需要 的 样子 确实 比重 头 写 要 快 些 。 

但 复制 粘贴 却 还 是 让 我 们 感觉 不 目 在 。 我 们 都 知道 ， 楚 停 下 来 不 一 定 真 的 就 能 停 下 来 ， 束 像 
众所周知 的 美味 荔 片 ， 谁 都 明白 只 要 吃 了 第 一 片 ， 要 想 停 下 来 就 很 困难 了 。 而 且 ， 我 们 也 怀疑 这 
个 省 事 的 做 法 可 能 会 让 我 们 的 项 目 走 下 坡 路 ， 导致 设 计 越 来 越 差 、 维 护 工作 顾此失彼 。 的 确 ， 大 
多 数 专 业 人 士 都 说 代码 克隆 是 毋庸 置疑 的 坏事 。 但 有 多 坏 呢 ? 我 们 又 如 何 来 确定 呢 ? 

所 以 我 们 可 以 停 下 来 思考 一 下 , 也 许可 以 再 癌 同 目 己 : 代码 复制 到 底 有 多 大 人 危害 ?从 长 远 来 
看 , 代码 复制 是 否 会 市 来 明显 的 维护 问题 ? 我 们 到 底 为 什么 要 复制 代码 ? 每 个 开发 人 员 复 制 代 码 
的 原因 征 否 相同 , 是 人 耕 有 些 原因 相对 来 说 更 站 得 住 脚 ” 代 码 复 制 有 无 任何 可 取 之 处 我们 能 不 能 
用 好 代码 复制 ， 如 琳 可 以 的 话 需 要 做 哪些 付出 ? 

这 些 都 古 值得 研究 的 好 问题 。 作 为 软件 工程 的 研究 员 , 我 们 发 现 每 次 在 参加 关于 代码 复制 的 
讨论 的 时 候 ， 讨 论 的 前 捉 都 征 : 代码 复制 是 个 彻头彻尾 的 坏事 情 。 但 我 们 的 个 人 经 历 又 让 我 们 坚 
信 其 实 代码 复制 并 没 那 么 坏 。 所 以 我 们 决定 用 目前 最 先进 的 代码 元 隆 检 测 工 具 , 对 一 个 大 型 的 开 
源 项 目 做 一 些 定性 和 定量 研究 一 一 结 琳 令 我 们 大 吃 一 惊 。 


28.1 ”代码 元 隆 的 示例 


在 我 们 继续 之 前 ,不妨 简单 地 探讨 一 下 代码 克隆 的 问题 空间 。 为 此 ,我 们 先 玉 看 看 下 面 两 个 
国 数 〈 均 来 自 Gnumeric 1.6.3 版 的 源 代码 ): 

// Bb RAR FRY py-gnyneruc.c, JRA1.6.3 

static PyObject * 


py_new_Range_object (GnmRange const *range) { 
py_Range_object *self; 
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self = PyObject_NEW (py_Range object, &py_Range object type); 
if (self == NULL) { 
return NULL; 
} 
self->range = *range; 
return (PyObject *) self; 
} 


static PyObject * 
py_new_RangeRef_object (const GnmRangeRef *range) { 
py_RangeRef_object *self; 
self = PyObject_NEW (py _RangeRef_object, &py RangeRef_object_type) ; 
if (self == NULL) { 
return NULL; 
} 
self->range_ref = *range_ref; 
return (PyObject *) self; 
} 


乍 一 看 ,好 像 很 明显 其 中 一 个 国 数 是 从 另外 一 个 复制 粘贴 而 来 (或 者 两 者 都 是 从 别处 粘贴 过 
来 ) ， 因 为 两 者 几乎 每 个 语言 标记 (token) 都 能 完全 对 上 。 事 实 上 ， 稍 稍 调查 一 下 ， 就 会 发 现 ， 
这 些 实际 上 是 实例 化 Python 对 象 的 时 候 的 样板 代码 。 这 些 函 数 有 两 点 不 同一 个 很 明显 ， 而 男 一 
个 稍稍 微妙 一 些 。 比 较 明 显 的 区 别 是 部 分 标识 符 有 所 不 同 : 第 一 个 国 数 中 的 标识 符 的 后 绥 是 
Range， 而 第 二 个 是 RangeRef。 稍 微微 妙 一 些 的 区 别 在 参数 上 : 第 一 个 国 数 的 参数 是 指向 对 象 
(这 里 是 C 结 构 体 妈 struct) 的 和 量 指针 ， 而 第 二 个 国 数 的 参数 是 指 同 帝 量 对 象 的 指针 。 后 者 是 
编程 时 候 的 常用 方法 ， 当 一 个 对 象 被 传 来 传 去 的 时 候 , 我 们 希望 能 确定 它 不 会 被 谁 修改 。 而 不 同 
的 是 ， 前 者 所 做 的 事情 是 保证 指针 参数 不 被 修改 ， 但 是 却 不 能 保证 指针 所 指向 的 对 象 不 被 改变 。 
对 于 有 经 验 的 C 程 序 员 来 说 ， 这 更 像 是 一 个 错误 ， 因 为 参数 的 改变 不 会 影响 到 调用 的 环境 ， 所 以 
把 参数 作为 各 量 的 意义 不 大 。 也 许 参 数 申明 中 的 const 放 错位 置 了 。 

那么 到 底 是 怎么 回 事 ? 我 们 的 猜测 是 ， 第 一 个 函数 是 原版 ， 而 第 二 个 是 克隆 ， 因 为 我 们 认为 
开发 人 员 更 可 能 去 添加 而 不 是 删除 一 个 后 级 。 此 外 ， 我 们 怀疑 在 克隆 版 中 这 个 参数 的 bug 已 经 被 
发 现 并 被 修复 了 , 但 是 没有 对 应 地 修改 原版 。 如 果 事 实 却 是 如 此 ， 那 么 这 就 是 我 们 所 谓 的 维护 工 
作 顾 此 失 彼 ， 在 有 些 版 本 中 bug 被 解决 了 ， 而 有 些 又 没有 解决 。 这 是 我 们 认为 代码 克隆 最 大 的 
毛病 。 

另 一 个 反对 使 用 代码 克隆 的 主要 原因 是 因为 它 会 让 系统 设计 越 来 越 差 。 这 就 有 点 怒 从 了 ， 明 
明 是 先 有 标 歼 的 设计 ,然后 才 导 致 了 代码 的 琐碎 而 让 人 搞 不 明白 设计 的 本 意 , 不 是 吗 ? 如 采 我 们 
能 把 这 些 重复 的 东西 剥离 出 来 并 统一 地 放 到 代码 库 中 专门 的 位 置 , 然后 再 通过 代入 不 同 的 参数 来 
使 用 它们 , 不 是 更 好 吗 ? 用 面 辐 对 象 的 术语 来 说 , 束 是 如 果 我 们 能 将 继承 和 泛 型 结合 来 使 设计 更 
加 简单 有 效 ， 不 是 更 好 吗 ? 

就 前 一 个 例子 来 说 ， 如 果 对 整个 代码 库 没 有 很 详细 的 了 解 ， 就 很 难 知 道 “ 正 确 ” 的 设计 应 该 
ETARKI. EDEA AEA, 但 是 代入 参数 的 新 方法 会 好 一 些 吗 ?过 度 的 剥离 会 不 会 导致 代 
码 难 以 读 民 ， 然 后 义 导致 维护 问题 呢 ?” 这 些 也 是 很 好 的 问题 。 
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28.2 守 找 软件 中 的 克隆 代码 


寻找 克隆 代码 从 技术 上 来 说 是 很 有 意思 的 : 如 来 东 了 段 代码 被 复制 然后 按照 新 的 需求 修改 了 一 
下 , 你 如 何 用 日 动 化 的 工具 来 识别 它 呢 ”如 霖 所 有 的 克隆 代码 邦 古 一 成 不 变 地 完全 复制 粘贴 的 话 
(有 一 些 确实 如 此 )， 那么 要 找 出 克隆 代码 就 很 售 单 了 。 但 是 , 通常 粘贴 过 来 的 代码 都 会 按照 新 的 
需求 进行 一 定 修 改 ， 比 如 修改 或 者 删除 几 行 代码 或 者 添加 一 些 新 的 代码 等 。 所 以 ， 也许 我 们 在 继 
续 之 前 应 该 先 搞 消 苇 一 个 辐 题 ， 到 瓜 什 么 是 克隆 代码 ? 

当然 ,首先 我 们 应 该 往 意 一 氮 ， 那 束 是 几乎 所 有 的 克隆 代码 的 探测 方法 实际 上 都 是 在 测量 代 
码 块 的 相似 度 。 也 就 是 说 ， 我 们 通 第 无 法 获取 实际 的 记录 “Ctrl-C, Ctrl-V” 这 些 事件 的 日 志 ， 

们 只 能 根据 代码 块 的 相似 度 的 高 低 来 推断 其 是 否 有 过 复制 粘贴 。 

其 次 ,对 于 相似 度 到 底 代 表 什 么 或 者 相似 度 多 高 多 低 才 能 算 克 隆 也 没有 一 致 的 说 法 。 比 如 这 
方面 的 研究 员 IraBaxter 束 喜欢 说 ,， 代码 殉 隆 就 是 相似 的 代码 块 …… 基 于 茶 个 相似 度 的 定义 。 检 
测 工具 使 用 的 技术 各 有 不 同 。 有 些 工 具 把 程序 看 做 字符 是 的 序列 ， 并 对 其 进行 字面 上 的 比较 。 有 
些 工具 对 比 标记 流 (\token stream) , 抽象 语法 树 (abstract syntax trees) 以 及 程序 依赖 关系 图 (program 
dependence graphs ) 。 另 一 些 工 具 使 用 度量 或 者 比较 程序 组 件 的 轻 量 级 语义 模型 (lightweight 
semantic models) 的 方法 。 还 有 越 来 越 多 的 工具 开始 使 用 训 合 的 方式 ， 在 大 范 围 使 用 不 需要 太 高 
计算 能 力 的 方法 ， 而 在 小 范围 使 用 需要 对 计算 能 力 要 求 较 高 的 方法 。 

虽然 五 伦 八 门 的 技术 让 这 个 研究 领域 显得 很 有 趣 , 但 是 实际 上 在 研究 中 ,代码 克隆 的 定义 大 
部 分 还 是 得 取决 于 使 用 的 工具 。 例 如 ,用 简单 的 字符 串 比 较 是 找 不 出 标识 符 的 变化 的 。 这 样 就 意 
味 着 ,对 于 两 段 代码 是 不 是 克隆 , 不 同 的 工具 就 有 可 能 得 出 不 同 的 结 来 。 其 至 当 专 家 们 坐 在 同一 
个 房 旧 并 杀 目 对 代码 进行 检查 的 时 候 ， 也 当当 在 “到 底 多 相似 才能 算 殉 隆 ” 这 个 同 题 上 达 不 成 共 
识 “ 。 不 用 说 ， 共 识 的 缺乏 会 妨碍 研究 的 进展 : 由 于 没有 “黄金 标准 ”或 者 公认 的 衡量 法 ， 很 
难 知 道 我 们 的 结 示 到 撒 是 好 征 坏 ， 也 很 难 对 于 各 种 工具 做 槛 癌 比 较 。 

即便 如 此 ， 对 于 代码 殉 隆 的 问题 域 的 证 清 其 实 也 还 是 有 一 些 进 展 的 。Bellon 等 人 创立 了 一 套 
为 代码 克隆 分 类 的 制度 ， 现 在 已 经 被 业内 人 士 广泛 采用 。 


















































e 1[] 
两 段 代码 在 字面 上 完全 等 同 ( 可 能 需要 忽略 代码 注释 或 者 纯 用 于 排版 的 空格 )。 
e 2i] 


除了 标识 符 以 及 直接 写 在 代码 中 的 常量 值 (A21, "test"®) 可 能 有 不 同 以 外 ， 两 段 
代码 在 字面 上 完全 等 后 
e 3[] 
除了 满足 2 型 克隆 的 标准 以 外 ， 属 于 本 类 型 的 两 段 代码 还 可 能 包含 一 些 不 同 的 “分 卜 ”。 
正如 我 们 之 前 所 说 的 ,要 检测 1 型 克隆 非常 简单 。 在 用 一 个 简单 的 词法 处 理 (lexical processing) 
将 代码 文本 正规 化 之 后 ， 有 很 多 算法 都 可 以 对 处 理 好 的 代码 行进 行 序列 分 析 。 
而 检测 2 型 克隆 就 要 难 多 了 。 词 法 分 析 器 可 以 做 一 些 简单 的 重 写 (比如 ， 将 所 有 标识 符 换 成 
“id"”， 所 有 的 字符 串 常 量 都 换 成 “foo”) ， 接 下 来 ,要么 可 以 把 生成 的 标记 流 作为 普通 的 纯 文 本 来 





28.3 对 代码 克隆 行为 的 调查 399 


分 析 ， 要 么 可 以 使 用 编程 语言 特定 的 分 析 技 术 来 分 析 。 

最 有 趣 的 万 3 型 ， 要 找 出 它们 要 更 难 一 些 ， 因 为 他 们 需要 合理 的 界定 值 : 两 段 代 码 必须 连续 
有 多 少 相 同 才 算 匹 配 ? 两 段 匹配 的 代码 最 多 可 以 有 多 少 “ 分 蚊 ”? 如 琳 界 定 值 太 宽松 的 话 ， 随便 
哪 两 段 代 码 都 可 以 被 认 作 古 3 型 克隆 | 

而 且 并 不 是 所 有 克隆 检测 工具 都 可 以 整齐 地 对 应 到 Bellon 竺 人 的 分 类 定义 。 比 如 有 一 些 基于 
度量 的 检测 法 就 不 只 起 纯粹 基于 程序 结构 ， 而 古 将 程序 放 段 的 结构 和 旭 义 综合 成 为 一 个 个 的 数 
字 ， 然 后 再 对 比 这 些 数字 。 

Alt, 至少 在 目前 这 个 时 刻 ， 我 们 可 以 理直气壮 地 说 ， 对 于 “我 的 软件 项 目 中 有 多 少 代 码 殉 
隆 ” 这 样 的 问题 ,确实 没有 一 个 权威 的 党 和 案 。 但 这 并 不 意味 着 我 们 就 该 洗 洗 睡 了 。 过 去 的 经 验 让 上 
RIRE, 我 们 能 找 出 很 大 一 部 分 存在 于 软件 项 目 中 的 代码 克隆。 所 以 我 们 决定 ， 使 用 最 先进 的 
WRR RAT WE AREK, RARER ETE. 
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在 软件 工程 师 之 间 有 一 个 不 成 文 的 规矩 ， 而 且 大 部 分 人 都 欣然 接受 这 个 规矩 ， 那 就 是 : 代码 
克隆 是 件 坏事 。 彻 头 彻 尾 的 坏事 。 好 吧 ， 短 期 来 看 克隆 确实 可 以 帮 你 省 点 事 儿 ， 但 是 长 期 来 说 ， 
克隆 是 件 坏事 。 事 实 上 ，Kent Bek (E: 改善 赋 有 代码 的 设计 》” (与 Martin Fowler 同 车 ) 
一 书 里 “代码 的 坏 味道 ”一 章 中 ， 正 好 这 样 写 道 : 

坏 味 道行 列 中 首当其冲 的 就 是 重复 代码 。 如 果 你 在 一 个 以 上 的 地 点 看 到 相同 的 程序 

i, MATAH R: 设法 将 它们 合 而 为 一 ， 程 序 会 变 得 更 好 。 

根据 我 们 的 经 验 和 直觉 来 看 , 这 个 观点 把 复杂 的 问题 给 过 分 简单 化 了 。 例如 , 我 们 的 同事 Jim 
Cordy 提 醒 我 们 ， 从 软件 工程 的 角度 来 看 ， 使 用 已 经 存在 的 解决 方案 有 时 是 必要 的 : 比如 像 
FORTRAN 和 COBOL 这 样 的 语言 ， 语 法 奇特 ， 进 行 高 度 抽象 能 力也 有 限 ， 已 经 存在 的 解决 方案 稍 
被 视 为 是 可 以 重用 的 工具 ， 可 以 在 经 过 调整 之 后 适用 于 新 的 情况 。( 这 听 起 来 好 像 是 应 该 由 软件 
库 来 做 的 事情 ， 但 是 通常 来 说 这 类 解决 方案 无 法 整齐 地 打包 成 库 。) 

所 以 我 们 决定 从 另 一 个 角度 来 看 这 个 问题 : 在 商用 软件 系统 中 ,克隆 代码 有 什么 特点 ?有些 
什么 模式 ? 我们 能 使 用 静态 分 析 来 识别 克隆 代码 吗 ? 我 们 能 判断 什么 时 候 克 隆 是 合理 甚至 有 利 
的 设计 方法 吗 ? 有 了 相关 知识 和 实证 研究 的 帮助 , 我 们 能 不 能 把 代码 克隆 作为 正当 的 开发 方法 ? 

基于 同事 以 及 我 们 自己 以 前 对 于 代码 克隆 的 检测 和 分 析 的 探索 , 我 们 开始 着 手 创建 一 个 克隆 
模式 的 目录 。 在 记录 这 些 模式 的 时 候 ， 我 们 使 用 了 下 面 这 个 模板 : 

O 模式 的 名 字 ; 

O 主观 地 描述 一 下 程序 员 用 这 个 模式 来 克隆 代码 的 初 袁 ， 

O 优点 和 缺点 列表 : 

口 描述 程序 员 接 下 来 可 能 面 对 的 管理 和 长 期 维护 问题 ， 
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O 用 代码 描述 一 下 这 个 克隆 模式 结构 上 的 特征 ( 即 如 何 用 工具 进行 自动 识别 ); 

口 一 组 已 知 的 案例 。 

了 最 后 我 们 确定 三 个 截然 不 同 的 克隆 大 类 : 分 又 、 模 板 和 定制 。 在 每 个 大 类 下 和 面 ， 我 们 又 识别 
出 了 很 多 克隆 模式 。 下 和 耐 我 们 将 概述 一 下 这 些 类 别 和 模式 ， 如 果 需 要 更 详细 的 信息 ， 你 可 以 阅读 
我 们 关于 这 个 主题 的 论文 ”。 


28.3.1 NX 


IX (forking) 是 指 开发 人 员 想 要 用 已 有 的 解决 方案 来 快速 解决 另 一 个 环境 中 的 相似 问题 。 
一 般 来 说 ， 原 版 的 代码 会 直接 复制 到 新 的 源 文件 ， 然 后 原版 和 克隆 版 两 个 版 本 将 被 独立 地 维护 ， 
当然 可 能 中 间 还 包含 开发 团队 之 则 的 一 些 协调 工作 。 分 又 有 助 于 保护 系统 的 稳定 性 ,因为 可 以 使 
变 体 向 边 绿 发 展 ， 远 离 核心 组 件 。 通 过 这 种 方式 , 硬件 或 者 平台 变 体 和 系统 的 其 他 部 分 实际 上 古 
通过 一 个 虚拟 层 来 互动 ， 即 使 需要 测试 前 不 成 熟 的 功能 ， 也 不 会 对 主 系统 造成 影 啊 。 当 变 体 需 要 
独 并 发 展 ， 尤 其 古 其 长 期 发 展 路 线 尚 不 明度 的 时 候 ， 分 又 元 隆 不 失 为 一 个 好 的 办 法 。 

分 又 之 下 ， 我 们 发 现 了 以 下 三 种 模式 .。 

eHUUU 

硬件 变 体 是 指 : 新 的 硬件 和 之 前 的 硬件 相互 之 间 在 程序 语义 上 非 第 相似 , 但 是 又 有 所 不 

同 ， 所 以 需要 做 一 些 特别 的 处 理 。 例 如 ， 在 Linux 操 作 系 统 中 ， 一 个 SCSI 卡 的 驱动 程序 有 可 

能 需要 支持 多 个 硬件 版 本 。 当 新 的 大 同 小 异 的 SCSI 卡 发 布 的 时 候 , 新 的 驱动 就 有 可 能 基于 已 

有 驱动 〈 即 基于 复制 过 来 的 代码 ) 来 做 。 由 于 驱动 程序 都 是 独立 维护 ， 所 以 通 笛 来 说 新 的 代 

码 和 旧 的 正 第 工作 的 代码 会 分 隔 开 来 ,以 免 产 生 辣 后 兼容 性 的 回 题 。 此 外 ,驱动 程序 通常 古 

打包 成 为 单一 的 程序 ， 想 要 将 通用 的 小 部 件 重 构成 可 以 共享 的 组 件 比 较 困 难 。 


eHUUU 

平台 变 体 和 硬件 变 体 紧密 相连 。 当 系统 中 有 一 个 对 应 不 同 功 能 的 抽象 层 , 并 且 可 以 针对 
不 同 目标 平台 (或 操作 系统 ) 来 实现 的 时 候 , 就 可 能 产生 平台 变 体 。Apache Portable Runtime 
(APR) 就 是 一 个 很 好 的 例子 : 程序 使 用 由 APR 提 供 的 通用 API 来 访问 系统 的 底层 服务 ， 比 如 
内 存 分 配 或 者 文件 MO。 通用 API 在 不 同系 统 上 的 实现 古 不 同 的 ， 但 是 从 代码 的 层面 上 来 看 ， 
津 第 又 是 非 第 相似 的 。 大 部 分 APR 实 现 被 划分 到 各 个 OS 特定 的 目录 ， 并 且 各 个 版 本 之 间 的 
代码 元 隆 度 非常 高 。 这 样 的 克隆 反而 古 有 好 处 的 ,因为 开发 人 员 可 以 对 各 个 变 体 进行 单独 维 
护 ， 并 且 可 以 再 针对 某 个 OS 做 特定 的 修改 。 不 过 需要 注意 的 一 点 是 ， 在 针对 不 同 操作 系统 
的 APR 的 开发 人 员 之 间 有 着 大 量 的 沟通 , 从 而 能 够 最 大 限度 地 减少 设计 偏差 和 顾此失彼 的 维 
护 所 市 来 时 风险 。 
eHUUU 

FR FA SK ber BE AS TTA IPT ee, GH ASA 7 ek Eh EA EIR FY he 
(branch)， 但 是 开发 人 员 想 要 尝试 一 些 新 功能 ， 而 这 些 功能 又 可 能 对 系统 的 性 能 或 者 可 靠 性 
审 来 一 些 负面 影响 。 开 发 人 员 会 创建 一 个 安全 的 沙 盒 ,， 用 一 个 元 隆 系统 来 实验 新 的 想法 和 功 
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能 。 然 后 他 们 会 把 感觉 不 错 的 新 功能 及 时 地 由 移植 回 主 代码 库 中 ,而 克隆 的 系统 有 可 能 被 扔 
挥 ， 也 有 可 能 目 己 变 成 新 的 主 代码 库 。Apache 项 目 、Linux 内 核 项 目 以 及 其 他 很 多 著名 的 开 
源 项 目 都 大 量 地 使 用 了 实验 变 体 这 种 方法 。 


28.3.2 ”模板 


模板 是 指 在 所 需 的 抽象 机 制 (如 继承 或 泛 型 ) 不 存在 的 时 候 ， 对 现 有 代码 进行 直接 复制 的 行 
为 。 当 原版 和 克隆 版 的 代码 需求 类 似 (比如 行为 需求 类 似 或 者 都 使 用 某 个 库 ) 的 时 候 ， 我 们 就 把 
它们 归 为 模板 一 类 。 当 这 些 需 求 变化 的 时 候 , 所 有 版 本 必须 保持 一 致 ,例如 下 面 这 段 来 自 Gnumeric 
1.6.3 有 版 的 代码 : 


gnumeric oct2bin (FunctionEvaliInfo *ei, GnmValue const * const *argv) 
{ 
return val_to_base(ei, argv[0], argv[1]l, 
8, 2, 
QO, GNM const (7777777777.0), 
V2B_STRINGS_MAXLEN | V2B_ STRINGS BLANK ZERO) ; 
} 


gnumeric_hex2bin (FunctionEvaliInfo *ei, GnmValue const * const *argv) 
{ 
return val_to_base(ei, argv[0], argv[1]l, 
16, 2, 
0, GNM_const (9999999999.0), 
V2B_STRINGS_MAXLEN | V2B_ STRINGS BLANK ZERO) ; 
} 


这 些 冰 数 的 区 别 只 在 于 函数 名 和 所 用 的 数字 常量 值 。 有 和 经验 的 C 程 序 员 可 以 看 出 ， 这 是 简单 
的 格式 转换 函数 。 在 面 癌 对 象 的 编程 语言 中 ， 继 承 和 认 型 的 存在 大 大 简化 了 类 似 功 能 的 实现 。 不 
过 话说 回来 ， 像 C 这 样 的 流程 式 的 编程 语言 确实 篆 肖 需要 创造 一 大 堆 类 似 的 函数 。 这 个 现象 通 惫 
会 造成 很 多 小 的 代码 克隆 : 如 朵 有 m 种 输入 格式 和 n 种 输出 格式 ， 那 么 就 必须 创建 和 维护 m*n 个 几 
平 完 全 相同 的 函数 。 虽 然 这 个 方法 从 数学 层面 上 来 看 确实 很 笨拙 ， 而且 实施 起 来 也 很 麻烦 ,但 编 
程 语 言 在 未 达 能 力 上 的 限制 又 使 得 我 们 不 得 不 采用 它 。 在 这 类 情况 下 ， 代 人 码 殉 隆 束 无 法 避免 了 。 
在 模板 类 别 下 ， 我 们 发 现 了 4 种 模式 。 
o [| [| 10) [O U [] Parameterized Codel| 
这 种 模式 的 特点 是 克隆 代码 之 间 直 白 而 精确 的 对 应 ( 见 前 面 一 段 代 码 )。 如 果 有 更 强大 
而 且 表 达能 力 更 好 的 程序 语言 ,只 需 使 用 集成 或 者 泛 型 这 样 的 功能 , 就 可 以 很 容易 地 把 这 些 
克隆 合并 成 一 个 单独 的 函数 。 有 了 时候 参数 化 的 代码 是 由 特殊 工具 自动 生成 的 , 以 避免 意外 的 
划 误 。 在 Java 还 没有 加 入 这 型 功能 的 日 子 里 ，JDK 曾 经 用 过 这 种 技术 。 
*HUUU 
这 种 模式 和 代入 参数 的 代码 差不多 , 但 是 要 求 要 宽松 一 些 , 不 需要 像 后 者 那么 精确 的 对 
应 。 这 个 模式 在 由 旧式 流程 式 程序 语言 (如 COBOL 及 FORTRAN) 写成 的 系统 中 尤其 常见 。 
在 这 些 语 言 写 成 的 系统 中 ,已 有 的 代码 解决 方案 被 看 作 是 智 总 的 结晶 ,值得 用 来 学 习 、 重 用 
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和 效仿 ,在 程序 语言 中 缺乏 对 用 户 自 定义 抽象 概念 的 支持 往往 意味 着 一 个 相对 简单 的 问题 可 
能 需要 见长 、 复 杂 和 不 便 使 用 的 方式 来 解决 。 当 开发 人 员 第 二 次 过 到 类 似 问 题 的 时 候 ， 他 就 
可 能 选择 复制 之 前 的 解决 方案 再 进行 调整 ， 而 不 是 全 部 重 写 ， 以 免 过 到 过 的 错误 再 次 发 生 。 
样板 文件 和 代入 参数 的 代码 的 区 别 就 在 于 , 克隆 版 本 之 间 的 差别 无 法 简单 地 用 一 个 解决 方案 
来 概括 。 
e APIU U 

这 个 模式 是 样板 文件 的 一 个 变 体 , 在 这 个 模式 中 ,程序 员 在 调用 一 个 库 或 者 框架 的 时 候 ， 
采用 了 一 和 套 推荐 的 使 用 规则 。 比 如 说 ， 当 使 用 JavaSWING API 来 创建 一 个 按钮 的 时 候 ， 常 见 
的 顺序 是 : 创建 按钮 、 添 加 到 容 细 ， 再 指定 动作 监听 如 。 同 样 地 ， 在 Unix 环 境 下 用 C 语 言 来 
构建 一 个 网 络 套 接 字 的 时 候 ， 也 需要 调用 某 个 库 中 的 一 系列 既定 的 国 数 。 而 这 些 库 (尤其 十 
HER) 的 文档 通常 是 以 “上 手指 南 ” 的 方式 来 写 的 ， 其 中 包含 了 很 多 代码 疙 例 ， 用 来 演示 各 
种 和 见 任务 的 实现 方法 。 这 些 文档 通 稼 辟 励 读者 复制 这 些 范 例 到 目 己 的 代码 , 并 进行 修改 以 
适应 目 己 的 需求 。 


e DDOUD 

这 个 模式 指 的 是 ， 在 整个 代码 库 中 系统 地 使 用 程序 语言 特定 的 惯例 (programming 
idioms) 来 执行 某 些 底层 任务 。 例 如 ， 在 Apache 的 代码 库 中 ， 对 于 在 内 存 池 中 如 何 创建 一 个 
指向 特定 平台 的 数据 结构 的 指针 ,就 有 着 明确 的 使 用 惯例 。 首 先 , 检查 在 内 存 池 中 的 数据 结 
构 是 人 否 包 含 指针 。 如 来 不 存在 ， 那 么 就 给 其 分 配 空 间 ， 并 将 其 地 址 赋值 给 指针 。 这 个 惯例 的 
存在 古 因为 APR 库 使 用 了 类 似 定义 的 数据 结构 ， 用 于 指 问 特定 平台 的 结构 (如 pthreads)。 这 
些 数据 结构 还 将 储存 和 其 概念 相关 的 特定 平台 的 数据 ， 如 线程 的 退出 状态 。 此 外 ,这 个 惯例 
还 有 一 些小 的 变 体 ， 比 如 有 一 些 会 包含 检查 内 存 池 是 否 存 在 ， 如 琳 不 存在 就 返回 错误 。 我 们 
发 现在 APR 子 系统 中 ， 这 个 惯例 出 现 了 至 少 15 次 。 
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当 现 有 代码 可 以 解决 一 个 和 当前 问题 很 相似 的 问题 , 但 又 没有 相似 到 可 以 直接 复制 代码 的 时 
修 ， 就 会 出 现 定制 的 情况 。 有 时 候 定 制 并 不 只 因为 技术 原因 ， 而 更 多 是 基于 省 理 上 的 压力 ， 比 如 
代码 的 所 有 权 问 题 或 者 想 要 把 没 测 试 的 代码 和 测试 好 的 代码 区 分 开 来 等 。 在 这 种 情况 下 , 想 要 实 
现 新 的 功能 不 能 “在 本 地 ”修改 现 有 的 代码 ， 所 以 只 能 将 其 复制 到 系统 的 其 他 位 置 进行 调整 。 

定制 和 分 又 、 模 板 有 下 面 一 些 不 同 。 在 定制 大 类 下 ， 新 的 设计 和 古 从 原版 代码 中 随 着 时 间 推 移 
慢 慢 衍 生出 来 的 ， 而 克隆 代码 只 是 实现 新 设计 的 起 点 。 从 长 还 来 看 ， 殉 隆 的 代码 和 原版 的 代码 之 
旧 几 乎 没有 什么 协调 和 同步 的 工作 。 在 分 又 大 类 下 ,虽然 变 体 在 细 市 上 都 是 独立 发 展 , 但 是 当 共 
同 的 外 部 需求 变化 的 时 候 ， 各 个 变 体 的 开发 组 之 间 还 是 会 协商 解决 问题 。 在 模板 大 类 下 ， 各 个 代 
码 殉 隆之 间 的 关系 更 为 期 密 , 因为 正 征 由 于 语言 的 表达 能 力 不 够 或 者 系统 的 设计 不 好 导致 了 这 些 
克隆 不 能 被 合并 为 一 个 单独 的 抽象 概念 。 模 板 和 分 又 的 目标 通 条 都 是 高 度 维持 原版 的 行为 ,而 定 
制 只 是 为 了 重用 原版 的 行为 , 通常 不 需要 各 个 版 本 的 行为 一 直 维 持 非 党 相似 的 状态 。 像 定制 这 样 
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没有 任何 规矩 可 言 的 克隆 和 其 他 的 克隆 相 比 : 克隆 之 间 的 区 别 可 能 更 不 明显 , 行为 的 变更 所 市 来 
的 影响 可 能 更 难 理解 ， 而 对 克隆 代码 的 检测 也 可 能 更 加 困难 。 
在 定制 类 别 下 ， 我 们 发 现 了 两 种 模式 。 
e OU bug UU 
FEFF BRAK BRAS —Fbug, {AeA AAP WEFT IE CET Be, ESS LY ot 
BE. (BACB BRR RES, 所 以 只 能 把 出 问题 的 国 数 复制 粘贴 到 一 个 他 可 以 修改 的 模块 或 者 
类 里 面 (而 且 还 可 能 是 在 一 个 高 手 的 指导 下 这 样 做 的 )。 在 面向 对 象 的 程序 语言 里 ， 这 个 问 
题 很 好 解决 :你 可 以 创建 一 个 新 的 继承 自 有 问题 的 类 ， 并 替换 出 问题 的 函数 。 
*HUUUUU 
当 开发 人 员 发 现 了 一 个 功能 , AME Bix TET AE ASCH He IT ee AF 
会 使 用 这 个 模式 。 这 种 复制 有 可 能 古 小 规模 和 小 沁 围 的 复制 , 也 有 可 能 征 大 规模 和 大 泥 围 的 
复制 。LaToza 等 注 革 到 在 微软 中 ， 大 规模 和 大 这 围 的 复制 是 一 种 现行 的 做 法 他们 称 为 “元 
条 并 认领 ”(clone and own) “。 当 一 个 开发 组 希望 使 用 处 于 其 他 开发 组 控制 下 的 特定 的 功能 
代码 的 上 时候， 他 们 可 以 选择 复制 一 份 原 代码 到 目 己 的 系统 中 ， 并 按 需 求 修改 。 但 如 来 要 这 样 
做 的 话 , 团队 之 则 需要 一 种 默契 ， 那 就 是 克隆 代码 的 团队 将 对 这 段 代 码 将 来 的 维护 和 发 展 负 
贡 , 即 他 们 “认领”* 了 这 个 克隆 (更 多 关于 这 个 主题 的 信息 请 参见 参考 文献 [1] 和 参考 文献 [4)。 
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我 们 提出 的 分 类 是 基于 我 们 对 于 多 个 开源 软件 系统 代码 克隆 的 分 析 经 验 。 这 些 系 统 包 括 
Linux 内 核 、Apache httpd] HARI at, Postgre SQL 关 系数 据 库 系统 、Gnumeric 电 子 表格 程序 、 
Columba 电 子 邮 件 客户 端 、 九 个 文本 编辑 器 (包括 Vim 和 emacs) 以 及 八 个 X11 窗 口 管理 右 。 对 于 
每 一 个 模式 , 我 们 都 在 多 个 系统 中 有 多 次 发 现 ， 所 以 我 们 非常 确信 这 些 模式 是 真实 而 且 普 遍 存 在 
有 的， 而 不 是 特定 于 某 个 系统 或 者 某 个 类 型 的 应 用 程序 。 虽 然 我 们 非常 确信 代码 克隆 党 被 作为 一 种 
正当 的 开发 方式 ， 但 是 我 们 却 缺 乏 具 体 可 量化 的 证 据 。 所 以 我 们 研究 了 两 个 不 同 领 域 的 大 型 开源 
系统 ,并 尝试 去 测量 (至少 在 这 两 个 系统 中 ) 代 码 克 隆 作为 一 个 正当 的 设计 工具 的 应 用 有 多 普 人 壳 。 

我 们 使 用 了 我 们 自己 的 叫做 CLICS (CLoning Interpretation and Categorization System ， 克 隆 解 
读 及 分 类 系统 ) 的 克隆 检测 工具 来 对 这 些 大 型 系统 进行 刀 历 和 分 类 。CLICS 将 源 代 码 标记 化 ， 并 
用 后 缀 数组 来 寻找 带 参 数 的 字符 串 匹 配 。 这 和 CCfinder 等 工具 使 用 的 方法 类 似 。 为 了 检测 那些 修 
改 了 变量 名 字 的 克隆 ， 这 个 工具 将 所 有 标识 符 都 统一 替换 成 一 个 替代 标记 ， 也 即 是 说 ， 任 意 两 个 
标识 符 都 可 以 相互 匹配 。 而 剩 下 的 标记 ， 如 关键 字 、 操 作 符 和 分 隔 符 等 ， 都 在 识别 克隆 代码 段 的 
过 程 中 起 重要 作用 。 不 过 ， 这 个 方法 将 会 导致 大 量 的 误 报 ， 因 为 忽略 实际 标识 符 使 得 很 多 有 用 的 
言 电 丢 失 。 因 此 ， 我 们 对 初步 结 末 进行 了 严格 地 租 选 ， 以 去 除 可 能 是 误 报 的 结束 。 例 如 ， 在 经 过 
我 们 这 样 的 处 理 之 后 , 在 C 语 言及 类 似 的 语言 中 的 所 有 switch 语 句 看 上 去 都 很 像 , 即便 它们 实际 
做 的 事情 大 相 径 许 。 对 于 这 些 特别 容易 引起 误 报 的 情况 ， 我 们 使 用 了 更 为 严格 的 筛选 条 件 。 

如 琳 两 段 代码 通过 了 我 们 的 匹配 条 件 以 及 目 动 化 过 小 ,我 们 就 认为 他 们 是 一 对 克隆 。 然 后 我 
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们 观察 了 代码 所 在 的 源 文件 区 域 , 以 更 好 地 理解 这 些 结 东 。 我 们 采取 的 详细 步骤 可 以 在 我 们 的 论 
文中 找到 ， 而 向 化 版 的 步骤 描述 就 征 : 我 们 将 文件 分 割 成 一 个 个 的 函数 界限 以 及 其 他 的 “区 域 ” 
(例如 struct 定 义 区 域 等 )， 再 认定 代码 区 域 之 间 的 克隆 关系 。 我 们 找到 克隆 代码 所 在 的 区 域 ， 
再 寻找 和 这 个 区 域 的 代码 有 克隆 关系 的 其 他 区 域 。 我 们 管 这 些 区 域 叫 做 元 隆 区 域 组 (Regional 
Groups of Clones，RGC)。 这 些 克 隆 区 域 组 代表 了 软件 系统 中 代码 元 隆 的 粗略 情况 。 在 这 个 层面 
上 的 情况 可 能 对 开发 人 员 更 有 意义 。 我 们 研究 的 大 部 分 使 用 元 隆 区 域 组 作为 基础 , 这 是 因为 在 我 
们 看 来 ,用 克隆 区 域 组 可 以 比较 直观 地 看 出 代码 殉 隆 是否 重要 。 所 以 对 于 每 个 系统 ,我 们 的 报告 
都 包括 找到 的 元 隆 代码 对 以 及 克隆 区 域 组 的 数量 。 

对 于 我 们 的 研究 , 我 们 决定 只 当 有 30~ 60 个 连续 匹配 的 标记 的 时 候 , 才 券 虑 两 段 代码 存在 元 
隆 的 可 能 性 。 这 两 个 数字 是 根据 我 们 此 前 在 这 个 领域 的 工作 经 验 得 出 的 。 

我 们 挑选 了 曾经 饶 究 过 的 两 个 大 型 开源 系统 : Apache 和 Gnumeric。 我们 选择 这 两 个 系统 的 原 
Ale: 它们 都 很 成 功 、 资 格 很 老 、 规 模 相 似 并 且 来 自 不 同 的 领域 。 在 版 本 上 ， 我们 选择 T Apache 
的 2.2.4 版 ， 其 中 共有 300 000 行 代码 分 布 于 783 个 文件 之 中 ， 以 及 Gnumeric 的 1.6.3 版 共有 300 000 
行 代码 分 布 于 530 个 文件 中 。 

使 用 我 们 之 前 接 述 的 规则 ，CLICS 在 Apache 项 目 中 找 出 了 21 270 个 元 隆 和 1580 个 克隆 区 域 
组 ， 在 Gnumeric 项 目 中 找 出 了 11 400 个 克隆 和 3437 个 克隆 区 域 组 。 看 上 去 挺 多 的 ， 不 是 么 ? 多 是 
很 多 ， 但 征 对 于 我 们 分 析 的 这 类 系统 来 说 并 不 意外 。 也 就 是 说 ， 代 码 殉 隆 在 大 型 系统 中 很 笛 见 ， 
甚至 可 能 比 你 想象 的 要 肖 见 得 多 。 

我 们 分 别 从 这 两 个 系统 中 随机 选择 了 100 个 克隆 区 域 组 。 然 后 ， 我 们 人 工 检查 了 每 一 个 组 ， 
并 试 着 回答 : 这 个 克隆 是 该 用 , 不 该 用 或 者 干脆 就 古 根 本 无 法 如 免 。 我们 认为 该 用 的 殉 隆 古 指 那 
些 对 其 他 可 能 的 解决 方案 有 一 定 改进 作用 的 元 隆 。 不 该 用 的 克隆 是 指 那 些 明 显 可 以 有 更 好 的 巷 代 
解决 方案 的 殉 隆 ， 也 指 那些 可 能 是 由 于 开发 人 员 偷 籁 、 设 计 人 和 偏差 或 者 其 他 不 民情 况 造 成 的 克隆 。 
无 法 避免 的 克隆 征 指 那些 由 于 过 于 琐 雁 而 难以 做 重 构 所 造成 的 克隆 , 也 指 那些 没有 其 他 合理 的 替 
代 解 决 方案 而 造成 的 非 用 克隆 不 可 的 情况 。 节 和 凋 被 视 为 无 法 避免 的 殉 隆 是 API 协 议 ， 因 为 这 些 协 
议 难 以 被 抽象 化 ， 而 且 开 发 人 员 通 第 对 原版 代码 也 没有 控制 权 。 我 们 也 发 现 了 一 些 误 报 的 情况 : 
Apache 的 克隆 区 域 组 中 有 7% 古 误 报 , 而 在 Gnumeric 的 克隆 区 域 组 中 , 我 们 通过 人 人工 判 断 ， 有 29% 
征 误 报 。 这 些 误 报 造 成 的 结 采 就 是 在 下 面 这 些 表 格 中 ， 每 个 系统 的 总 和 不 征 100。 

下 面 这 个 表格 总 结 了 我 们 的 发 现 。 我 们 只 显示 了 连续 匹配 60 个 标记 的 克隆 ,因为 匹配 长 一 些 
的 克隆 更 值得 我 们 关注 ， 而 且 也 不 太 可 能 是 误 报 。 经 我 们 鉴定 ， 总 的 来 说 有 大 概 有 35.4% 的 克隆 
是 该 用 的 ， 而 不 该 用 的 稍微 多 一 些 ， 还 有 15.2% 的 克隆 是 完全 无 法 避免 的 。 对 我 们 来 说 ， 这 很 好 
地 证 明了 开源 软件 开发 人 员 常 第 用 代码 元 隆 作 为 正当 的 开发 工具 。 



































分 类 模 式 Apache: Apache: Apache: Gnumeric: Gnumeric: Gnumeric: 
5 该 用 无 法 避免 。 ”不 该 用 该 用 无 法 避免 不 该 用 
分 叉 ”硬件 变 体 0 0 0 0 0 0 


分 又 平台 变 体 10 0 0 0 0 0 
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(2) 
分 类 模 式 Apache: Apache: Apache: Gnumeric: numen: Gnumeric: 
该 用 无 法 避免 不 该 用 该 用 无 法 避免 不 该 用 

分 又 ”实验 变 体 4 0 0 0 0 0 
模板 样板 代码 5 0 0 6 0 l 
模板 ”编程 惯例 0 0 12 l 0 0 
模板 API 协议 0 17 0 0 8 l 
模板 ”参数 化 的 代码 5 l 12 10 0 24 
定制 bug 解决 方案 0 0 0 0 0 0 
定制 ”复制 并 专门 化 12 0 4 15 0 l 
其 他 3 0 8 1 0 3 
总 共 39 18 36 33 8 30 


必须 要 说 明 的 是 , 我 们 这 绝对 不 是 在 对 克隆 的 相对 危害 性 下 结论 。 我们 尽 了 最 大 的 努力 来 完 
善 我 们 的 克隆 分 类 ,但 是 肯定 也 会 有 其 他 的 分 类 法 ， 其 至 可 能 有 相关 的 组 织 性 原则 ” (organizing 
principles) 的 存在 。 除 此 之 外 ， 任 何 实证 研究 本 身 也 不 可 能 做 到 完美 。 首 先 ， 我 们 自行 设计 和 执 
行 了 这 次 人 研究。 如 末 能 启用 更 为 中 立 的 常 三方 人 员 来 判断 元 隆 的 危害 的 话 , 束 可 以 降低 偏见 的 问 
题 ， 不 过 这 就 需要 牺牲 部 分 的 专业 判断 能 力 。 而 且 ， 我 们 只 研究 了 两 个 系统 ， 而 整个 大 千 世 界 中 
有 数 不 清 的 程序 种 类 。 从 统计 学 的 角度 来 看 , 只 有 两 个 系统 既 无 法 证 明 统 计 结 果 有 足够 的 显著 性 ， 
也 无 法 证 明 其 具备 代表 性 。 而 且 两 个 系统 都 是 开源 的 ， 这 就 有 可 能 使 得 我 们 的 结果 更 加 片面 。 最 
后 ， 对 于 有 一 些 同 题 ， 我们 并 没有 可 以 作为 答案 的 数据 ， 比 如 克隆 对 于 代码 质量 的 长 期 影响 ， 顾 
此 失 彼 的 维护 带 来 的 风险 是 否 值得 注意 等 , 不 过 已 经 现在 已 经 开始 有 一 些 相 关 的 研究 了 。 我们 
认为 ， 代 码 殉 隆 作 为 正当 的 开发 方法 得 到 了 强 有 力 的 证 据 支 持 。 

虽然 详细 的 研究 结果 可 以 在 我 们 的 论文 中 找到 , 但 在 这 里 值得 指出 的 是 , 我 们 在 两 个 系统 中 
找到 的 一 些 有 趣 的 区 别 。 其 中 之 一 是 ,我 们 发 现 Apache 大 量 地 (并 且 我 们 认为 是 合理 地 ) 使 用 了 
分 又 克 隆 ， 而 Gnumeric 没 有 。 这 并 不 令 我 们 意外 ， 因 为 Apache 提 供 了 一 大 套 很 底层 的 服务 。 这 些 
服务 的 目的 是 直接 在 各 类 平台 之 上 运行 , 使 得 APR 所 提供 的 虚拟 环境 (我 们 已 知道 APR 使 用 了 很 
多 平台 变 体 模式 ) 可 以 发 挥 作用 。 而 Gnumeric 的 跨 平台 性 依赖 于 GTK 控 件 集 ， 而 这 个 控件 集 并 非 
Gnumeric 的 一 部 分 。 我 们 还 发 现 Gnumeric 相 对 于 Apache 化 平 使 用 了 更 多 的 参数 化 的 代码 模式 。 经 
过 人 工 检查 我 们 发 现 , 很 多 基于 用 户 界面 操作 的 功能 的 实现 方式 都 非常 相似 ， 所 以 造成 了 这 种 克 
条 模式 。 最 后 ， 需 要 注意 的 是 ， 这 些 数 字 只 是 基于 对 来 自 两 个 系统 的 克隆 区 域 组 的 100 个 随机 取 
样 的 结果 ， 分 别 占 了 Apache 克 隆 区 域 组 总 数 的 6%，Gnumeric 的 3%。 























28.5 总结 
我 们 开篇 问 了 一 个 简单 的 问题 : 代码 克隆 是 不 是 真 的 像 有 些 人 说 的 那么 一 无 是 处 ? 我 们 在 本 





O 指 用 于 帮助 分 类 的 基准 。 一 一 译 者 广 








草 中 对 大 型 开源 软件 中 代码 克隆 的 研究 结 末 回答 了 这 个 问题 : 代码 克隆 非但 不 是 一 无 是 处 ,而且 
在 有 些 时 候 反而 是 正确 而 正当 的 事情 ! 我 们 通过 思考 实验 ” (thought experiement) 得 出 了 这 个 假 
说 ， 并 得 到 了 实证 研究 的 支持 ， 所 以 现在 我 们 非常 确定 我 们 的 结论 是 正确 的 。 当 然 ， 有 趣 的 研究 
通 负 会 在 回答 问题 的 时 候 ， 也 市 来 很 多 新 的 问题 ， 我 们 的 研究 也 不 例外 。 在 回答 了 开篇 的 问题 之 
后 , 还 有 这 样 一 些 辣 题 值 得 我 们 关注 : 除了 已 经 介绍 的 ， 另外 还 有 些 什么 代码 克隆 模式 ?各 种 类 
型 的 克隆 的 风险 训 高 误 低 ? 在 不 同 的 程序 领域 中 , 克隆 的 风险 有 什么 不 同 ? 跨 应 用 程序 进行 代码 
克隆 会 有 什么 后 末 ?” 有 哪些 工具 或 者 程序 语言 文 持 可 以 缓解 维护 的 压力 并 降低 克隆 的 风险 ? 好 
了 ， 这 些 都 是 很 好 的 问题 ， 那 就 让 我 们 留待 下 回 分 解 吧 ，。 
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你 的 API 有 多 好 用 


Steven Clarke 


1999 年 11 月 , 我 加 入 了 Visual Studio (下 称 “VS”) 的 用 户 体验 团队 进行 用 户 体验 方面 的 研究 。 
我 很 高 兴 成 为 这 个 团队 的 一 员 , 因为 我 在 前 一 份 工作 中 使 用 的 产品 束 是 他 们 设计 的 。 还 征 在 摩托 
罗拉 工作 的 时 候 ， 我 就 总 古 想 要 对 VS 的 用 户 体验 进行 大 刀 阔 佐 的 改革 ， 现 在 终于 有 机 会 了 。 虽 
然 我 现在 已 经 很 明白 改善 开发 人 员 体 验 的 重点 不 一 定 在 开发 工具 上 , 但 当初 意识 到 这 个 问题 却 花 
了 我 将 近 一 年 的 时 间 。 

当 刚 加 入 这 个 团队 的 时 候 ， 我 将 所 有 注意 力 都 集中 在 了 理解 开发 人 员 使 用 VS 的 方式 上 上。 我 
和 我 的 同事 们 一 起 伦 了 无 数 个 小 时 观察 开发 人 员 如 何 使 用 VS， 包 括 他 们 如 何 创 建新 项 目 、 如 何 
汐 加 新 的 类 到 已 有 的 C++ 项 目 中 以 及 如 何 调试 Web 服 务 等 。 我 们 发 现 了 很 多 有 用 的 信息 ， 可 以 更 
好 地 了 解 用 户 ， 并 利用 这 些 了 解 来 设计 和 创造 一 个 更 好 的 开发 工具 。 

但 是 好 像 少 了 点 什么 。 虽然 开发 人 员 对 于 开发 工具 的 使 用 体验 不 断 在 改善 , 他们 的 整体 开发 
体验 却 并 没有 提高 那么 多 。 所 以 我 们 需要 改变 关注 的 重点 。 与 其 纠结 于 开发 人 员 很 少 做 的 事情 CHE 
也 不 会 天 天 创建 新 项 目 吧 )， 我 们 应 该 更 多 地 将 注意 力 放 在 开发 人 员 经 常 做 的 事情 上 。 而 所 谓 匣 
做 的 事情 ， 就 是 谈 、 写 、 调 试 那些 使 用 了 很 多 不 同 API 的 代码 。 所 以 我 们 开始 了 度量 和 改善 开发 
人 员 的 类 库 和 API 使 用 体验 的 一 段 温 证 长 路 。 

刚 开 始 的 时 候 我 们 没 找 对 方法 。 不 过 ,多亏 谢 力 和 对 于 改善 用 户 体 验 的 强烈 愿望 ,我 们 还 古 
成 功 地 了 解 了 一 点 ， 那 就 是 怎样 的 API 才 算 好 用 。 在 这 个 过 程 中 ， 我 们 学 到 了 很 多 教训 ， 有 一 些 
其 至 让 我 们 对 于 开发 人 员 如 何 写 代码 这 个 最 基本 的 事情 都 产生 了 疑问 。 在 这 一 革 中 , 我 将 和 你 分 
胖 我 们 一 路 走 来 的 这 些 故 事 。 


29.1 为 什么 研究 API 的 易 用 性 很 重要 
和 图 形 用 户 界面 不 同 , 开发 人 员 并 不 直接 通过 可 视 化 操作 办 法 来 和 API 进 行 互 动 。 正 好 相反 ， 
开发 人 员 需 要 将 文字 写 人 文本 编辑 器 ， 然 后 编译 和 运行 程序 。 所 以 说 开发 人 员 并 不 直接 和 API 互 


动 ,而 是 直接 和 他 们 写 代 码 和 运行 代码 的 工具 互动 。 很 显然 这 些 工 具 的 易 用 性 对 于 开发 人 员 编 写 
和 运行 这 些 使 用 API 的 代码 的 能 力 有 着 很 大 的 影响 。 
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但 是 只 需要 知道 这 个 就 行 了 吗 ?” 如 琳 有 一 个 理想 世界 ， 而 这 个 世界 中 的 开发 工具 是 完 
的 …… 那 么 开发 人 员 编写 和 运行 这 些 使 用 API 的 代码 的 体验 也 就 完美 了 吗 ? 让 我 们 假设 工具 是 完 
美的 ， 再 考虑 一 下 设计 拙劣 的 API 对 于 开发 人 员 的 影 啊 。 
API 提 供 了 一 些 组 件 来 执行 一 些 笛 见 的 任务 ， 它 们 本 来 应 该 是 用 来 增加 开发 人 员 的 效率 的 。 
诚然 ， 很 多 时 候 开 发 人 员 需 要 使 用 API 来 完成 一 些 任务 ， 因 为 这 下 唯一 能 访问 封 交 好 的 系统 功能 
的 办 法 ， 而 系统 功能 无 法 从 去 开始 实现 。 就 算 这 些 系统 隐 藏 功能 无 需 特殊 权限 就 能 直接 调用 ， 
API 也 可 以 贡 省 开发 人 员 实 现 这 些 功能 组 件 的 时 间 和 精力 。 不 入 的 是 ， 议 计 精 糙 的 API 让 人 无 法 
分 辨 使 用 它 广 省 下 来 的 时 间 能 不 能 抵消 它 的 使 用 成 本 。 
关于 这 一 后 ，Alan Blackwell 提 出 了 一 个 模型 ， 用 来 判断 征 否 应 该 使 用 目 定义 的 解决 方案 而 
不 是 现 有 的 API  。 在 这 个 模型 中 ， 开 发 人 员 需 要 估计 使 用 API 的 认 知 成 本 〈 即 知道 是 什么 ) DA 
及 学 习 成 本 ( 即 知 道 怎 么 用 ), 然后 再 用 回报 (即使 用 API 可 能 广 省 的 时 间 和 精力 ) 来 权衡 这 些 成 
本 。 这 个 模式 已 经 考虑 到 了 役 有 回报 的 可 能 性 。 
在 进行 分 析 时 , 开发 人 员 将 使 用 API 设 计 中 的 提示 (如 类 的 名 称 、 方 法 的 名 称 以 及 相关 文档 ) 
来 估计 所 需 的 成 本 。 开 发 人 员 可 能 会 认 出 API 所 使 用 的 特定 设计 模式 ， 这 将 能 帮助 他 更 好 地 学 习 
如 何 使 用 API。 开 发 人 员 也 有 可 能 用 过 API 的 茶 些 部 件 ， 这 也 可 能 让 人 找到 学 习 的 方法 。 此 外 ， 
开发 人 员 对 于 API 相 关 领 域 的 了 解 ， 也 能 成 为 学 习 API 的 过 程 中 的 另 一 种 视角 。API 的 指示 、 设 计 
模式 、 开 发 人 员 早 前 使 用 API 的 经 验 以 及 对 API 工 作 领 域 的 了 解 ， 都 将 帮助 他 们 估计 自己 实现 这 
样 的 功能 需要 的 工作 量 。 人 然后 ， 他 便 可 以 决定 契合 要 使 用 API 了。 
不 过 ， 也 有 很 多 事情 会 妨碍 开发 人 员 准 确 地 佑 计 所 需 工作 量 。 
O 类 的 名 称 或 者 文档 可 能 有 误导 性 或 者 不 难 确 。 这 些 东 西 晓 示 API 做 的 事情 和 API 实 际 上 做 
的 事情 可 能 并 不 一 致 。Martin Robillard 表 示 ， 学 习 API 的 最 大 障碍 ， 束 是 缺乏 摘 述 API 和 
其 使 用 方法 的 良好 资源 。 

O 关于 名 称 的 男 一 个 常见 问题 古 多 重 伟 义 。 要 人 确定 具体 名 称 ， 通常 需要 首先 对 API 设 计 的 概 
念 模型 有 所 了 解 。 

O 此 前 使 用 过 的 API 的 部 件 和 剩 下 的 部 件 的 工作 方式 可 能 并 不 一 致 ， 尤 其 是 当 API 的 设计 理 
念 并 没有 统一 地 贯 罕 于 整个 系统 中 的 时 候 。 

口 开发 人 员 所 预想 的 API 的 工作 方式 和 其 实际 的 工作 方式 可 能 有 很 大 不 同 。 

遗憾 的 是 ， 开 发 人 员 很 难 立 刻 就 断定 API 的 议 计 不 一 致 、 类 和 方法 的 名 称 有 问题 或 者 和 他 所 
预想 的 工作 方式 不 同 。 在 估计 API 的 使 用 成 本 时 ， 有 一 个 很 大 的 问题 ， 那 加 是 开发 人 员 币 和 间 需 要 
目 己 先 用 这 个 API 做 一 个 小 的 程序 ,才能 据 此 佑 计 在 更 大 一 些 的 程序 中 使 用 这 个 API 需 要 化 辟 多 少 
时 间 。 只 有 当 他 开始 用 这 个 API 写 代码 的 时 候 ， 他 才能 发 现 这 个 API 在 设计 上 的 奇特 和 怪异 之 处 。 

最 重要 的 是 ， 这 为 开发 人 员 已 经 估计 好 的 工作 量 加 上 了 额外 的 负担 ， 使 用 API 的 成 本 很 容易 
就 会 超过 目 己 写 解决 方案 的 成 本 。 正 因 如 此 , 开发 人 员 可 能 会 觉得 API 不 但 不 能 提升 他 们 的 效率 ， 
实际 上 反而 降低 了 他 们 的 效率 。 

所 以 致力 于 帮助 开发 人 员 了 解 API 的 使 用 成 本 的 论坛 、 网 站 和 博客 一 视 蜂 地 前 现 了 出 来 。 比 
如 StackOverflow.com 这 样 的 网 站 , 就 让 开发 人 员 可 以 提 一 些 关 于 API 使 用 方面 的 问题 并 找到 答案 。 
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结案 就 是 开发 人 员 通 常 搞 不 明白 如 何 使 用 API， 只 得 花费 大 量 的 时 间 来 辛 蜗 论 坛 、 提 问题 和 
寻找 千 案 ,而 不 古 高 效 地 写 代码 。 这 打击 了 他 们 的 自 导 。 他 们 感觉 自己 做 的 事情 就 只 是 不 断 地 在 
各 种 论坛 上 施展 搜索 问题 的 技巧 , 并 从 搜索 结果 中 复制 粘贴 代码 。 感觉 程序 员 好 像 并 不 是 在 “ 写 ” 
程序 了 一 样 。 

而 且 即 便 是 完美 的 工具 也 不 能 解决 设计 不 佳 的 API 的 问题 。 虽 然 有 很 多 工具 可 以 帮助 开发 人 
员 编 写 和 运行 代码 ， 但 是 当面 对 设计 拙劣 的 API 的 时 候 ， 大 部 分 的 成 本 其 实 是 认 知 成 本 。 开 发 人 
员 必 须 思 和 孝 怎 样 才能 将 他 们 的 想法 用 这 些 像 苑 语 一 样 的 类 和 方法 表示 出 来 。 调试 融和 其 他 类 似 的 
分 析 工 具 可 以 帮助 开发 人 员 更 迅速 地 认识 到 API 的 预期 工作 模式 和 实际 工作 模式 的 区 别 。 但 是 开 
发 人 员 仍 然 需 要 处 理 这 些 工具 生成 的 信息 。 而 且 API 的 工作 模式 和 开发 人 员 的 预期 差别 越 大 ， 开 
发 人 员 就 需要 越 多 的 思维 转换 来 殉 服 这 种 差别 。 

与 此 形成 鲜明 对 比 的 是 ， 设 计 民 好 的 API 人 允许 开 发 人 员 准 确 地 估计 其 使 用 成 本 。API 中 使 用 
的 类 和 方法 的 名 称 让 开发 人 员 可 以 迅速 了 解 这 些 类 和 方法 所 做 的 事情 。API 中 的 类 和 方法 正好 符 
合 开 发 人 员 的 期 望 。API 的 各 个 部 分 的 类 和 方法 的 工作 方式 都 一 致 。 然 后 开发 人 员 便 能 进入 “ 共 
ARES ”-， 那 些 代码 就 像 直 接 从 他 们 思想 中 流 到 屏 大 上 一 样 。 即 使 开发 人 员 使 用 的 工具 并 不 是 最 
好 的 ， 他 们 仍然 可 以 很 轻松 地 使 用 该 API， 因 为 和 设计 得 很 差 的 API 不 同 ， 使 用 设计 民 好 的 API 并 
不 需要 太 依 赖 工具 。 在 理想 世界 里 ， 开 发 工具 其 实 只 有 输入 代码 和 运行 程序 两 个 作用 。 
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在 开发 人 员 的 整体 开发 体验 中 ，API 的 易 用 性 非常 重要 ， 这 一 点 似乎 很 明显 。 但 是 当 我 刚刚 
加 入 VS 用 户 体验 团队 的 时 候 ， 我 却 并 没有 意识 到 。 

作为 一 个 曾经 使 用 过 VS 的 开发 人 员 来 说 ， 我 常常 被 这 个 工具 搞 得 头 大 。 编 译 器 的 设置 既 难 
找到 ， 又 难 设置 。 配 置 库 的 路 径 显 得 十 分 腑 烦 。 这 些 就 是 在 我 刚刚 加 入 VS 用 户 体验 团队 的 时 候 
想 要 解决 的 多 用 性 问题 。 

这 并 不 是 说 我 就 没有 发 现 过 微软 API 的 问题 。 正 好 相反 ， 我 过 到 的 最 大 的 困难 中 ， 有 一 些 正 
好 是 和 学 习 微 软 基础 类 (MFC) 的 工作 方式 相关 的 。 不 过 我 没 像 平 时 一 样 抱怨 工具 不 好 用 ,实际 
上 当 这 些 MFC 不 像 我 想象 的 那样 工作 的 时 候 , 我 往往 是 贡 人 怪 目 己 学 习 能 力 不 够 。 我 从 没 想 过 这 个 
问题 可 能 和 API 的 设计 有 关 。 

对 于 设计 拙劣 的 API 来 说 ， 人 们 的 这 种 反应 非常 普遍 。 很 多 开发 人 员 都 不 肯 面 对 现实 ， 认 为 
API 难 用 的 原因 是 他 们 使 用 API 的 经 验 还 不 够 。 只 要 有 足够 的 时 间 ， 他 们 就 能 搞 明 白 。 我 们 已 经 
听 过 很 多 开发 人 员 把 问题 往 自己 身上 揽 了， 说 他们 不 够 聪明 所 以 不 会 用 某 个 API。 

所 以 ， 虽 然 我 是 VS 用 户 体验 团队 的 一 部 分 ， 但 是 我 没 能 意识 到 API 的 易 用 性 是 值得 研究 的 。 
这 个 想法 来 自 于 我 此 前 工作 的 团队 ， 当 时 我 们 正在 开发 一 套 全 新 的 API， 称 之 为 ATL Server。 

ATL Server 是 一 套用 于 开发 Web 应 用 程序 的 C++ API。 很 多 ATL Server 的 开发 人 员 、 测 试 人 员 
以 及 项 目 经 理 都 曾经 开发 过 MFC API。 他 们 在 开发 MFC 时 学 到 的 经 验 是 , 开发 人 员 有 时 候 并 不 知 
道 怎 样 设计 好 API。 他 们 在 开发 的 时 候 束 已 经 知道 有 一 些 设 计 上 的 决定 会 市 来 易 用 性 的 问题 。 但 
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是 现在 MFC API 已 经 发 布 而 且 很 多 用 户 已 经 在 使 用 了 ， 要 做 大 的 改变 就 太 迟 了 ,因为 任何 大 的 改 
变 都 有 可 能 使 用 户 的 现 有 代码 停止 工作 。 所 以 这 个 团队 开始 开发 一 套 全 新 的 API， 这 让 他 们 可 以 
在 正式 发 布 之 前 束 确 定 他 们 的 设计 是 否 正确 。 

由 于 我 是 为 这 个 团队 指派 的 易 用 性 工程 师 ,， 他 们 就 问 我 寻求 帮助 。 然 后 我 便 开始 尝试 找 出 研 
究 API 易 用 性 的 方法 。 

我 首先 想到 的 是 : API 有 那么 多 种 用 法 ， 我 怎么 才能 把 它们 都 研究 一 志 呢 ? API 能 做 的 事情 
实在 是 太 多 了 ， 我 不 可 能 一 一 研究 。 所 以 ， 我 将 研究 的 重点 放 在 了 API 的 整体 结构 上 。 因 为 我 认 
为 弄 清楚 API 中 类 的 组 织 结构 是 否 对 于 开发 人 员 来 说 有 意义 非常 重要 。 因 为 这 也 将 有 助 于 解决 与 
API 的 规模 相关 的 问题 ， 并 让 我 可 以 测量 开发 人 员 对 于 ATL Server 的 理解 和 其 实际 实现 的 相似 度 。 
我 的 想法 是 ， 只 要 能 找 出 开发 人 员 的 理解 和 ATL Server 的 实际 实现 的 不 同 之 处 ， 就 能 帮助 开发 团 
队 做 出 改进 。 

为 此 ， 我 用 卡 厂 分 类 法 来 分 析 了 该 API。 在 卡片 分 类 法 中 ， 每 个 参与 者 都 会 拿 到 一 车 卡片 。 
每 张 卡 片上 都 会 有 一 个 名 字 (或 者 一 个 概念 )， 用 来 代表 某 个 对 象 ， 如 网 页 、 产 品 或 者 方法 等 。 
参与 者 需要 一 张 一 张 地 将 他 们 认为 最 相近 的 卡片 放 到 一 堆 。 参与 者 可 以 根据 自己 的 判断 标准 将 这 
些 卡 请 分 类 。 当 所 有 的 参与 者 都 完成 卡片 分 类 之 后 ,研究 人 员 将 对 这 些 分 类 进行 聚 类 分 析 ， 找 出 
哪些 卡片 更 像 是 一 类 的 。 分 析 的 结果 ( 即 每 张 卡 片 最 常见 的 分 类 ) 用 树 状 图 来 表示 。 卡 片 分 类 法 
应 该 是 研究 开发 人 员 的 概念 模型 最 合适 的 方法 了 。 








29.2.1 研究 的 设计 


共有 14 名 经 验 丰 富 的 C++ 开发 人 员 参 与 了 这 次 人 赋 究 。 每 个 人 开发 人 员 每 周 都 有 超过 20 个 小 时 
需要 用 C++ 来 进行 开发 ， 工 具 是 VC++ v6.0 (研究 是 在 2000 年 3 月 进行 的 )。 这 些 开 发 人 员 都 没有 
太 多 Web 相 关 的 开发 经 验 。 由 于 ATL Server 的 重要 设计 目标 就 是 让 没有 什么 Web 开 发 经 验 的 开发 
人 员 也 能 顺利 进行 开发 ， 所 以 这 对 这 次 研究 来 说 正好 。 

我 从 ATL Server 的 API 中 找 出 了 24 个 核心 类 ， 作 为 本 次 研究 的 重点 。 表 29-1 列 出 了 这 些 类 。 


表 29-1 ATL Server 的 核心 类 


CStencil CMultiPartFormParser CWriteStreamHelper CHtmlStencil 
CISAPIExtension CHttpRequestParams CValidateObject CStencilCache 
CValidateContext CHttpRequestFile CDBSessionDataSource CHttpResponse 
TServerContext CPersistSessionDB CHttpRequest CCookie 
CSessionNameGenerator CDefaultErrorProvider CHtmlTagreplacer CSessionStateService 
CSessionState CRequestHandlerT CPersistSessionMem CD11Cache 


团队 的 技术 文档 专家 为 这 些 类 的 各 个 功能 都 撰写 了 短小 简明 的 介绍 。 这 些 介绍 基本 上 都 古 一 
两 句 话 长 。 每 个 介绍 都 被 印 到 了 一 张 索 引 卡 片上 。 例如 ,用 于 设置 /提取 类 的 成 员 变 量 的 赋值 /访问 
方法 对 应 的 就 是 写 着 “变量 管理 ”的 卡片 。 所 有 类 都 包含 的 方法 (如 构造 、 解 析 方 法 ) 没有 列 出 。 

这 些 类 所 实现 的 功能 共 汇 成 了 59 张 卡 厂 。 
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这 些 卡 片 只 有 功能 的 介绍 ， 没 有 类 的 名 字 。 

LCHttpRequest 类 为 例子 ， 它 包含 了 四 个 主要 的 功能 。 这 些 功 能 被 分 别 写 到 四 张 卡片 上 : 

O 获取 HTTP 请 求 数据 (如 名 - 值 对 、 表 单字 段 ); 

口 用 当前 请 使 用 求 的 信息 来 初始 化 对 象 

O 维护 请 求 的 缓存 ; 

O 提取 请 求 和 服务 器 变量 。 

最 后 ， 每 个 参与 者 还 将 拿 到 一 份 简 短 的 AIL Server 的 概览 文档 作为 参考 。 

参与 者 共有 90 分 钟 的 时 间 来 分 析 理 解 这 个 框架 ， 并 将 59 张 卡片 按照 他 们 的 理解 分 类 或 者 分 
组 。 参 与 者 归纳 的 分 类 数量 最 少 的 有 8 个 ， 最 多 的 有 14 人 个。 我们 用 电子 表格 记录 下 这 些 分 类 ， 并 
对 这 些 数据 进行 了 聚 类 分 析 。 
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聚 类 研究 表明 ， 这 些 分 类 有 三 个 前 见 的 类 和 群 。 第 一 个 类 和 群 包含 了 2 个 分 类 ， 第 二 个 包含 了 8 
个 ， 第 三 个 包含 了 其 余 的 〈 除 开 两 个 不 属于 任何 类 群 的 )。 

这 些 类 群 之 间 儿 乎 没有 什么 共同 点 。 研 究 小 组 伦 贯 了 大 量 的 时 间 , 想 要 确定 到 抵 这 样 的 类 群 
分 布 代 表 着 什么 ,但 是 蕊 无 收 狭 。 因 为 肾 类 分 析 的 结 未 古 参与 者 分 为 三 个 完全 不 同 的 类 和 群 ， 我 们 
只 能 认为 这 些 参与 者 们 的 概念 模型 没有 任何 共通 性 。 

看 来 第 一 次 实验 的 结 末 让 我 们 失望 了 。 三 个 类 群 完全 没有 任何 音义, 也 不 能 用 来 确定 改善 的 
措施 。 看 上 去 似乎 花 在 设计 、 执 行 和 分 析 研 究 上 的 时 间 都 浪费 了 。 

但 是 从 长 远 来 看 ,这 项 研究 反而 从 完全 不 同 的 方面 给 我 们 上 了 重要 的 一 课 。 它 使 我 们 知道 : 
API 的 易 用 性 并 不 是 整体 API 的 一 项 功能 。 只 靠 研 究 API 的 设计 淋 构 无 法 知道 所 有 的 易 用 性 相关 
问题 。 

我 一 直 执 着 于 用 证 记分 类 法 进行 研究 ,因为 我 一 直 担 心 规模 的 问题 : 我 怎么 才能 把 一 个 类 里 
面 的 所 有 功能 的 所 有 用 法 都 芳 虑 进来 呢 ? 不 过 在 进行 了 这 次 研究 之 后 , 我 终于 发 现 原 来 我 的 方 癌 
错 了 。 在 实际 使 用 中 ， 很 少 有 开发 人 员 会 去 关注 API 的 整体 结构 问题 。 他 们 一 般 只 关心 他 们 需要 
用 API 来 执行 的 任务 。 

不 同 的 人 会 对 API 有 不 同 的 使 用 感受 ， 因 为 第 一 他 们 需要 达到 的 目的 不 同 ， 第 二 他 们 有 着 不 
同 的 背景 ,第 三 他 们 有 着 不 同 的 工作 方式 。 一 味 想 去 确定 API 的 多 用 性 ， 而 不 把 这 些 因 素 孝 考虑 
进来 的 话 ， 就 容易 像 我 做 的 那个 卡片 分 类 法 那样 ， 得 出 无 效 的 结 采 。 

即便 卡片 分 类 法 能 找 出 共同 的 类 群 ， 我 们 也 无 法 和 弄 明 白 它 们 代表 什么 。 如 有 API 已 经 按照 分 
析出 来 的 功能 类 群 进行 了 修改 ， 那 么 我 们 又 该 如 何 来 确定 这 种 修改 对 于 API 的 易 用 性 有 多 大 影响 
ME? 我 们 只 知道 API 和 参与 者 的 概念 模型 对 应 起 来 了 ， 但 我 们 能 确定 这 和 古 件 好 事 吗 ?我们 真 的 应 
该 将 API 的 设计 和 还 没有 用 过 这 些 API 的 开发 人 员 的 概念 模型 对 应 起 来 吗 ? 

实际 上 ， 这 些 正 是 我 在 设计 和 执行 证 族 分 类 研究 时 想 要 解答 的 问题 ， 但 是 事后 再 来 回顾 时 ， 
我 却 发 现 这 些 问 题 其实 问 错 了 。 卡 片 分 类 研究 的 结果 使 我 认识 到 ， 如 果 想 要 真正 地 了 解 API 的 易 
用 性 ， 就 必须 研究 开发 人 员 如 何在 实际 工作 中 使 用 这 些 API 来 解决 实际 问题 的 。 
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钼 运 的 是 微软 的 企业 文化 帮 了 忙 ， 即 便 我 此 前 的 卡片 分 类 人 研究 并 没有 得 出 任何 有 用 的 结 来 ， 
我 仍 被 辟 励 继续 尝试 测量 和 拉 述 API 多 用 性 的 方法 。 


29.3 如果 一 开始 你 没有 成 功 


第 二 次 研究 API 易 用 性 是 在 18 个 月 以 后 。 那 时 ,我 正 与 VS 用 户 体验 团队 的 同事 们 一 起 进行 一 
项 研究 ， 即 经 验 丰富 的 Visual Basic 6 (下 称 “VB6”) 开发 人 员 能 不 能 用 Visual Basic.NET (下 称 
“VB.NET ) 来 写 基于 .NET 框 架 的 应 用 程序 。 

VB.NET 是 Visual Basic 程 序 语言 的 最 新 版 本 ， 和 此 前 的 版 本 (如 VB6) 有 着 本 质 上 的 不 同 。 
它们 最 大 的 区 别 是 : VB.NET 的 框架 提供 了 和 VB6 类 似 的 功能 ， 但 却 是 由 一 套 完全 不 同 的 类 和 命 
名 空间 组 成 。 此 外 还 有 如 下 一 些 区 别 。 例 如 ,在 VB.NET 中 ,默认 数组 索引 的 起 始 值 不 能 从 0 改 成 
1， 和 而 VB6 能 。 

我 们 的 团队 想 看 看 初次 接触 VB.NEI 的 开发 人 员 在 用 它 来 执行 一 些 简单 任 务 (如 从 硬盘 上 读 
写 文 本 文件 ) 时 的 体验 。 有 了 此 前 卡片 分 类 法 的 教训 ， 我 们 决定 换 一 种 方法 ， 即 让 参与 者 在 我 们 
的 易 用 性 实验 室 中 用 VB.NET 来 执行 一 些 特 定 的 任务 。 我 们 让 这 些 参与 者 在 执行 这 些 任务 的 时 候 
大 声 把 上 自己 的 想法 说 出 来 , 并 把 每 个 参与 者 执行 任务 的 过 程 都 了 永 下 来 。 我 们 将 对 每 个 参与 者 的 孙 
像 进行 分 析 ， 找 出 他 们 在 行为 上 的 共同 点 和 有 趣 的 亮点 ， 以 及 任何 能 帮助 我 们 更 好 了 解 VB.NET 
以 及 .NET 框 架 的 信息 。 





29.3.1 第 二 次 研究 的 设计 


我 们 招 芭 了 8 位 开发 人 员 ， 每 个 人 都 称 目 己 每 个 星期 至 少 会 伦 20 个 小 时 在 VB6 的 开发 上 。 我 
们 让 他 们 用 VB.NET 和 .NET 框 架 来 写 一 个 程序 ， 这 个 程序 将 从 硬盘 上 读 写 文本 文件 。 每 个 参与 者 
都 有 两 个 小 时 可 以 完成 这 项 任务 。 在 写 程序 的 过 程 中 ， 他 们 可 以 随意 地 浏览 所 有 可 用 的 .NET 框 
架 中 的 类 的 文档 ,每 个 参与 者 都 在 我 们 位 于 华盛顿 州 雷 德 蒙 市 办 公 区 的 易 用 性 实验 室 中 独立 完成 
这 些 任务 。 在 单 面 锐 背 后 ， 有 一 个 易 用 性 工程 师 将 操作 摄像 机 并 做 笔记 。 我 们 的 易 用 性 工程 师 只 
为 参与 者 解决 VS 预 发 布 版 的 bug 和 程序 月 涡 回 题 ， 除 此 以 外 不 会 从 任何 其 他 方面 帮助 参与 者 们 执 
行 任务 。 


29.3.2 第 二 次 研究 的 结论 摘要 








和 上 一 次 做 的 卡 厂 分 类 法 不 同 , 这 次 的 结 霖 就 很 有 局 示意 义 了 。 最 大 的 新 闻 就 是 没有 一 位 参 
与 者 能 在 两 个 小 时 之 内 完成 交 给 的 任务 。 

这 一 把 让 我 们 非常 于 外 。 我 们 并 不 指望 每 个 参与 者 部 能 顺利 完成 任务 ， 但 是 却 完全 没有 
意料 到 结 末 会 古 一 败 涂 地 。 我 们 的 第 一 个 反应 是 ， 这 些 参与 者 可 能 并 不 符合 我 们 招 努 研究 对 
象 的 要 求 ， 也 许 他 们 根本 就 不 古 经 验 丰 晤 的 程序 员 。 但 是 从 录像 上 来 看 ， 事 实 并 非 如 此 。 录 
像 清 楚 地 显示 ， 每 个 参与 者 痢 症 有 着 丰富 经 验 的 程序 员 ， 而 且 对 于 学 习 使 用 新 的 程序 语言 和 
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编程 环境 并 不 县 惧 。 

ABE Arnie AMA TEMES VE? 我 们 在 研究 完成 之 后 对 录像 进行 了 详细 的 分 析 。 我 们 在 分 析 
完了 所 有 的 永 像 并 将 最 有 代表 性 的 部 分 剪辑 出 来 之 后 , 几乎 立刻 就 将 这 些 剪 辑 好 的 代表 了 录像 发 送 
到 了 VS 开发 团队 手 上 。 这 些 永 像 剪 辑 展示 了 参与 者 们 在 执行 任务 的 过 程 中 遇 到 的 各 种 困难 。 我 
们 对 造成 这 些 困 难 的 原因 做 了 一 些 假设 。 

第 一 个 假设 是 : 文档 出 同 题 了 。 之 所 以 提出 这 个 假设 是 因为 我 们 观察 到 每 个 参与 者 都 花费 了 
大 部 分 的 时 间 在 搜索 和 查找 文档 上 。 他 们 在 文档 中 寻找 那些 可 以 帮助 他 们 从 硬盘 上 读 写 文 件 的 类 
或 方法 。 在 我 们 进行 此 次 研究 的 时 候 (2002 年 夏 )， 这 些 文档 还 没有 加 入 任何 执行 常见 任务 ( 例 
如 从 硬盘 上 读 写 文件 ) 的 代码 疙 例 。 

例如 ， 下 面 这 段 关 于 一 个 参与 者 如 何 寻 找 System.I0o 命 名 空间 的 转述 记录 就 很 典型 。 

参与 者 : 

[ 念 出 类 的 名 字 ] 

Binary reader, Buffered stream。 读 和 写 ……: 

[暂停 。 把 类 的 列表 往 下 拉 |] 











入 器 。 唔 …… 储 存 基础 字符 串 。 字 符 串 生成 器 。 文 本 :……… WE, Textreader, text writer。 代 表 


[暂停 ] 


[把 类 的 列表 来 回 拉 ] 

这 个 ,你 看 吧 ， 我 看 这 个 像 是 ,你 看 看 ， 更 像 古 底层 的 东西 。 但 我 只 想 创建 一 个 文本 文 

{i Wii 

[鼠标 指向 某 一 个 类 的 描述 ] 

按 编码 把 字 特 写 入 到 流 , 我 不 确定 这 个 …… 很 明显 是 一 个 把 字符 写 入 到 流 的 文本 写 入 絮 。 

[点 击 链 接 对 TextWriter 类 进行 查看 。 然 后 查看 其 派生 出 来 的 类 |] 

System.IO.StringWriter。 这 个 看 上 去 好 像 比 较 底 层 ， 不 是 我 要 找 的 文本 写 入 如 ,但 我 也 

AGE WE 

[浏览 TextWrite 类 的 介绍 ] 

文本 写 入 龙 应 该 是 为 输出 字符 而 设计 的 ， 而 这 个 stream 类 是 为 了 输入 输出 字 区 的 。 
[叹气 。 点 击 链接 查看 TextWriter 的 成 员 变 量 和 方法 ] 
By REX MAA REE, 

这 段 对 话 所 对 应 的 视频 非 党 具有 说 服 力 ， 而 我 们 也 正好 用 它 来 在 VS 产品 团队 中 宣传 我 们 的 
研究 结果 。 这 些 重要 的 视频 资料 使 得 我 们 对 VS 的 用 户 体验 有 了 深入 的 理解 ， 也 让 所 有 人 都 非常 
询 望 找 出 问题 所 在 以 及 解决 办 法 。 在 另 一 段 隶 像 里 ， 参 与 者 正在 和 编译 错误 做 斗争 。 

参与 者 : 

好 吧 。 我 们 又 回 到 这 个 错误 了 。 
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[阅读 编译 错误 讯息 ] 

System- 的 值 。 无 法 将 System.IO.Filestream 类 型 的 值 转换 为 System.IO.StreamWriter 类 

型 的 值 。 搞 不 懂 …… 

[暂停 ] 

(iE TIER ILS? 

很 多 开发 人 员 揪 住 一 点 不 放 : ABER SAE BT AE CE TA EE, MEMMEN] 
觉得 ， 要 想 改 善 用 户 体验 ， 最 好 的 办 法 就 是 修改 文档 。 如 采 文 档 可 以 提供 一 些 示 例 代 码 或 者 代码 
片段 ， 开 发 人 员 就 可 以 把 这 些 代码 复制 粘贴 到 自己 的 项 目 中 。 

但 是 , 我 们 想 要 和 弄 明 白 这 些 示 例 代 码 的 缺失 到 底 是 不 是 实验 室 中 所 发 现 的 易 用 性 问题 的 真正 
原因 。 虽然 在 这 个 阶段 (项 目的 生命 周期 已 度 过 四 分 之 三 ), 修改 文档 也 许 比 修改 API 的 成 本 要 低 
一 些 , 但 是 我 们 也 需要 芳 虑 万 一 文档 并 不 是 ?| 发 易 用 性 问题 的 真正 原因 的 情况 ,那样 的 话 文档 就 
日 修改 了 。 

为 了 让 我 们 更 有 信心 地 分 析 这 些 问 题 , 我 们 需要 一 个 分 析 框 架 或 一 种 语言 来 作为 我 们 分 析 的 
依据 。 由 于 产品 团队 在 看 了 录像 之 后 已 经 很 确信 问题 在 于 文档 , 所 以 如 果 没 有 这 父 分 析 框 染 的 话 ， 
我 们 将 很 难 癌 他 们 去 解释 和 证 明 我 们 的 进一步 分 析 。 最 后 我 们 采用 了 认 知 维度 (cognitive 
dimensions) 多 作为 框架 。 


29.3.3 AIE 


“ 认 知 维度 ”是 一 套用 于 分 析 编 程 语言 易 用 性 的 框架 ， 还 可 以 推 而 广 之 用 来 分 析 任 意 一 种 表 
示 法 ， 比 如 API。 这 套 框架 包括 13 个 不 同 的 维度 ， 这 些 维度 用 于 描述 以 及 衡量 表示 法 的 易 用 性 相 
KEM. 

这 些 维度 实际 上 组 成 了 对 表示 法 设计 的 全 面 调查 , 用 以 测量 其 易 用 性 的 方方面面 。 对 于 测量 
结果 我 们 可 以 找到 一 个 基准 (比如 某 一 类 开发 人 员 的 偏好 ) 来 进行 比较 ， 并 用 这 些 测量 和 比较 的 
结 末 来 确定 改善 措施 ， 即 如 何 使 表示 法 更 符合 基准 人 和 群 的 需求 。 

这 类 分 析 框 架 所 得 出 的 测量 结果 并 不 是 一 堆 数 字 , 其 至 不 一 定 是 一 些 绝 对 的 值 , 而 通常 是 在 
框架 定义 的 范围 内 进行 评级 。 虽 然 这 样 的 做 法 可 能 让 我 们 对 测量 结果 的 准确 度 产生 怀疑 , 但 是 这 
个 框架 的 魅力 正在 于 此 : 它 识 别 并 提供 了 相关 词汇 和 定义 , 使 我 们 可 以 基于 一 个 标准 来 细致 地 讨 
论 表 示 法 的 易 用 性 的 各 个 层面 。 如 果 没 有 这 样 一 个 框架 ， 任 何 关 于 表示 法 的 研究 都 会 陷入 困境 ， 
因为 易 用 性 的 特质 并 没有 一 个 统一 的 定义 和 标准 , 这 使 得 研究 人 员 们 对 于 一 些 重要 问题 (比如 哪 
些 层面 对 易 用 性 的 影响 最 大 ) 几乎 无 法 达成 共识 。 

我 们 对 这 些 维度 的 名 称 做 了 一 些 修改 ， 使 它们 更 符合 我 们 所 研究 的 API 易 用 性 ”这 个 范围 。 
对 于 每 个 维度 的 简短 描述 如 下 。 

e 0000 

API 所 表现 出 来 的 最 低 及 最 高 的 抽象 等 级 ， 以 及 目标 开发 人 员 所 用 到 的 最 低 及 最 高 抽象 


等 级 。 
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eHUUU 

API 所 提出 的 认 知 需求 ， 以 及 目标 开发 人 员 可 以 用 到 的 认 知 方式 。 
eHUUU 

REA cH FAA PIT eee A ae ( 即 开 发 人 员 的 工作 集 ”)。 
esUUUUUUDO 

在 一 个 步骤 内 可 以 或 者 必须 完成 多 少 编程 任务 。 
*HUUUU 

代码 只 要 完整 到 什么 程度 就 能 执行 并 将 其 行为 反馈 给 开发 人 员 。 
*HUUUY 

FRA REN TEMES HAAS TS ZA, He ZS ORE IK EER EP EIER. 
e 00D 


API 如 何 让 组 件 的 探知 、 分 析 和 理解 更 容易 ， 以 及 目标 开发 人 员 是 如 何 找 出 所 需要 的 东 
西 的 。 


e API] UU 

API 必 须 做 到 何 种 程度 才能 符合 目标 开发 人 员 的 需求 。 
e APIO O OL 

由 API 的 性 质 所 决定 的 修改 的 障碍 ， 以 及 目标 开发 人 员 需 要 多 少 工作 量 才 能 进行 修改 。 
e DDD 

在 学 习 了 API 的 一 部 分 之 后 ， 能 从 中 推导 出 多 少 其 他 部 分 的 使 用 方法 。 
e O00000 

API 的 每 个 组 件 之 间 的 关系 的 清晰 程度 ， 以 及 最 终 程序 的 整体 清晰 程度 。 
*HUUUUU 





APL SEPT TESTE AT EE, LAB IPRA RNASE CAI A ie ET HARARE 
技巧 。 
我 们 选择 这 个 框 染 的 主要 原因 是 它 写 称 很 容易 使 用 。Green 和 Petre 声 称 ， 认 知 维度 框架 可 以 
被 完全 没有 进行 过 正式 培训 或 者 完全 没有 认 知 心理 学 背景 的 人 使 用 i。 我 们 相信 ， 对 于 审阅 研究 
结果 的 开发 团队 来 说 ， 要 想 读 懂 这 些 结 果 ， 就 必须 使 用 这 样 一 个 与 之 对 应 的 框架 (或 者 语言 ) 作 
为 基础 。 
我 们 使 用 了 这 个 框架 来 描述 参与 者 执行 每 项 任务 的 体验 。 我 们 审阅 了 所 有 的 录像 ， 并 把 每 个 
我 们 观察 到 的 有 趣 时 刻 都 瘟 切 了 下 来 。 然后 我 们 将 每 段 录像 前 辑 孝 用 我 们 认为 相关 的 认 知 维度 做 
好 标记 ， 再 按 维度 来 评价 各 个 剪辑 。 也 就 征 阐 ， 我 们 把 所 有 “抽象 等 级 ”的 剪辑 一 起 评价 了 ， 所 
有 “僵化 程度 ”的 剪辑 也 一 起 评价 了 ， 等 等 。 这 种 方法 使 我 们 能 从 另 一 个 观 氮 来 审视 这 些 孙 像 。 
我 们 用 这 种 观点 来 更 清晰 地 摘 述 我 们 观察 到 的 难题 。 
重要 的 是 ,我 们 得 以 用 认 知 维度 框 染 来 说 服 开发 团队 : 单单 改善 文档 是 远 远 不 够 的 。 虽然 改 














中 Working set， 指 应 用 程序 在 某 个 时 间 范 围 内 会 引用 到 的 内 存 ， 此 处 为 比喻 。 一 一 译 者 广 
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善文 档 是 很 重要 的 ， 但 古 我 们 的 分 析 告 诉 我 们 ， 要 改 秋 多 用 性 还 需要 做 更 多 。 
Ee 分 析 表 明 ， 最 重要 最 根本 的 是 和 API 的 抽象 程度 相关 的 问题 。 为 了 更 详细 地 说 明 这 
一 尽 ， 我 们 可 以 看 看 某 个 参与 者 要 想 读 取 文本 文件 所 需要 写 的 代码 : 


Imports System 





Imports System.I1I0 


Class Test 
Public Shared Sub Main() 

Try 
' Create an instance of StreamReader to read from a file. 
Dim sr As StreamReader = New StreamReader ("TestFile.txt") 
Dim line As String 
' Read and display the lines from the file until the end 
' of the file is reached. 
Do 

line = sr.ReadLine() 
Console.WriteLine (Line) 

Loop Until line Is Nothing 
sr.Close() 

Catch E As FileNotFoundException 
' Let the user know what went wrong. 
Console.WriteLine("The file could not be found:") 
Console.WriteLine(E.Message) 

End Try 

End Sub 
End Class 


写 入 文本 文件 也 是 类 似 : 


Imports System 
Imports System.I1I0 


Class Test 
Public Shared Sub Main() 
' Create an instance of StreamWriter to write text to a file. 
Dim sw As StreamWriter = New StreamWriter("TestFile.txt") 
' Add some text to the file. 
sw.Write("This is the ") 
sw.WriteLine("header for the file.") 
sw.WriteLine ("------------------- " ) 
' Arbitrary objects can also be written to the file. 
sw.Write("The date is: ") 
sw.WriteLine (DateTime .Now) 
sw.Close() 
End Sub 
End Class 


这 些 代码 看 上 去 并 不 特别 复杂 。StreamReader 或 者 StreamWriter 的 构造 函数 使 用 一 个 表 
示 文 件 路 径 的 字符 串 作 为 参数 。 然 后 ， 它 们 分别 用 于 执行 从 硬盘 读 取 数据 或 者 写 和 人 数据 到 硬盘 的 
任务 。 

如 采 你 已 经 知道 怎么 来 完成 这 些 任务 ,然后 又 看 了 参与 者 们 如 何 绞 尽 脑 关 地 写 这 些 代 码 , Ap 
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么 自然 就 很 容易 直接 跳 到 结论 ， 说 问题 的 原因 是 文档 中 设 有 包含 执行 这 种 简单 任务 的 示例 代码 。 
毕竟 这 些 代码 已 经 简单 得 不 能 再 简单 了 嘛 。 

但 是 ， 当 我 们 把 这 些 好 像 茧 辑 和 相关 的 参与 者 的 评论 一 起 看 的 时 候 ， RISEN, 问题 并 
不 在 于 有 没有 示例 代码 。 例 如 ， 重 新 阅读 此 前 引用 过 的 一 段 参 与 者 的 解说 : 

参与 者 : 

System.IO.StringWriter。 这 个 看 上 去 好 像 比较 底层 ， 不 是 我 要 找 的 文本 写 入 大， 但 我 也 

不 确定 。 WE, series 

[浏览 TextWrite 类 的 介绍 ] 

文本 写 入 絮 应 该 是 为 输出 字符 而 设计 的 ， 而 这 个 stream 类 是 为 了 输入 输出 字 古 的。 

[叹气 。 点 击 链接 查看 TextWriter 的 成 员 变 量 和 方法 ] 

可 能 这 个 从 没 人 做 过 吧 。 

当 参 与 者 说 这 个 看 起 来 太 底 层 了 ， 他 指 的 是 他 正在 麟 览 的 类 的 抽象 程度 。 相 比 起 现在 的 API 
中 非常 灵活 ， 但 又 有 些 抽 象 的 、 基 于 流 的 实现 ， 参 与 者 更 希望 能 有 稍微 不 那么 抽象 的 、 更 具体 
一 些 鸭 实现 。API 对 于 这 个 任务 的 表示 与 参与 者 的 预期 大 相符 姓 。 也 就 是 说 ， 参与 者 不 得 不 调整 
目 己 对 于 文本 文件 的 理解 ， 才 能 认识 到 Streamwriter 和 StreamReader 正 是 用 来 解决 这 类 问 
题 的 类 。 

我 们 在 绝 大 部 分 的 参与 者 中 都 观察 到 了 这 个 情况 。 即 便 他 们 正在 族 贤 的 就 是 正确 的 、 可 以 让 
他 们 解决 问题 的 类 (如 StreamReader 或 StreamWriter) 的 文档 ， 也 会 由 于 和 他 们 所 想 的 不 同 
而 觉察 不 到 。 所 以 问题 的 关键 不 是 在 文档 中 缺乏 示例 代码 ,而 是 参与 者 第 笛 在 文档 中 搜寻 根本 不 
存在 的 信息 。 他 们 希望 能 找到 文本 文件 的 具体 表达 方式 ， 但 是 却 只 找到 文件 流 的 表达 方式 。 

认 知 维度 框架 给 了 我 们 一 套 语 言 , 使 得 我 们 可 以 用 这 套 语 言 来 更 好 地 分 析 理 解 研 究 中 观察 到 
的 问题 。 通 过 这 次 分 析 ， 我 们 使 开发 团队 认识 到 : 解决 易 用 性 问题 的 最 好 办 法 ,除了 改善 文档 质 
量 以 外 ， 还 需要 设计 和 创建 一 个 可 以 具体 地 表示 硬盘 上 的 文件 系统 以 及 文件 的 新 类 。 

半年 后 ， 开 发 团队 设计 并 实现 了 这 个 新 类 的 原型 版 本 。 使 用 这 个 新 类 (FileObject) 来 完 
成 和 此 前 同样 的 任务 所 需 的 代码 如 下 : 


Dim f As New FileObject 
£.Open(OpenMode.Write, "testfile.txt") 
f .WriteLine("A line of text") 
f.Close() 


在 这 个 例子 中 ， 每 个 Fileobject 类 的 实例 都 代表 着 一 个 文件 。Fileobject 类 可 以 有 多 种 
模式 . 〈 在 这 个 例子 中 ，openMode .Write 使 得 打开 的 文件 可 写 ) 。 这 和 此 前 的 例子 ， 即 用 不 同 的 
类 来 表示 不 同 的 模式 (如 Streamwriter 和 StreamReader)， 形 成 了 鲜明 的 对 比 。 

然后 我 们 召集 了 一 群 有 着 相同 背景 (但 并 不 是 同一 批 ) 的 参与 者 来 进行 类 似 的 研究 , 任务 相 
同 ， 只 是 这 次 使 用 的 是 Fileobject 的 API。 这 次 的 结果 就 明显 不 同 了 。 在 20 分 钟 内 ， 无 需 浏览 
任何 文档 ， 所 有 的 参与 者 都 顺利 完成 了 任务 。 
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29.4 使 用 不 同 的 工作 风格 


我 们 的 研究 不 仅 使 得 这 个 重要 的 API 加 入 了 一 个 新 的 类 ， 也 使 得 整个 微软 对 于 人 猎 究 产 生 了 新 
的 寻 重 和 热忱 。 在 每 个 .NET 框 染 的 API 发 布 之 前 必须 经 过 的 审核 流程 中 ， 加 入 了 API 多 用 性 研究 
的 步骤 。 

虽然 这 种 搜集 易 用 性 信息 的 方法 不 断 上 升 的 关注 度 使 我 们 大 受 或 舞 , 但 是 此 时 我 们 仍然 不 请 
楚 ， 开 发 人 员 对 于 API 的 易 用 性 是 各 说 各 话 ， 还 是 有 一 种 统一 的 量化 标准 。 我 们 选择 参与 文件 1/O 
研究 的 开发 人 员 的 痛 景 部 相 同 : 有 经 验 的 VB 开发 人 员 ， 每 周 使 用 VB 超过 20 个 小 时 。 但 是 不 同 育 
景 的 开发 人 员 会 奋 做 出 同样 的 反应 呢 ? 














我 们 的 预感 是 一 一 不 会 。 我 们 研究 的 参与 者 只 能 代表 在 研究 VS IDE 的 时 候 我 们 设 定 的 三 种 
开发 人 员 角 色 中 的 一 种 。 
*HUUUUUU 
af re RA Ae BE. ASE RES AB, UR EHME, RRHH. 
*HUUUUUU 


特点 是 以 代码 为 重点 ， 并 使 用 各 种 工具 〈 如 重 构 工 具 、 单 元 测试 工具 等 ) 来 帮助 他 们 确 

定 代码 的 可 靠 性 和 正确 性 。 

*HUUUUUU 

aE EL AVES HIE RIF IK, AKER RIE RZ AAR EM TARA — NEW T fi 

FE BTA SCPE OME FE PII RA ZEN BL RE ERRAR h EH 
Fileobject 类 的 方式 儿 近 完美 地 诠释 了 何 为 机 遇 型 编程 。 这 和 他 们 在 第 一 次 研究 中 必须 使 用 的 
更 为 抽象 的 类 形成 了 强烈 的 对 比 。 事 实 上 ， 我 们 对 于 文件 oO 的 研究 的 主要 结论 之 一 丈 征 ， 如 林 
役 有 这 样 一 些 顶 层 上 的 、 有 具 角 的 组 件 ， 机 遇 型 开发 人 员 便 很 难 顺利 完成 任务 。 

而 随 着 对 API 多 用 性 的 关注 度 不 断 走高 ， 我 们 开始 需要 确定 什么 样 的 API 才 能 使 务实 型 和 系 
统 型 的 开发 人 员 也 满 间 。 

这 三 种 角色 是 由 我 们 在 此 前 多 次 研究 中 对 开发 人 员 的 观察 得 来 的 ， 有 着 大 量 的 数据 作为 基 
础 。 我 和 一 位 同事 一 起 回顾 了 这 些 数 据 ， 并 针对 不 同 的 角色 根据 认 知 维度 框架 来 定义 相应 的 API 
多 用 性 。 

首先 ,我 们 为 每 个 维度 定义 了 一 套 评级 法 。 例 如 ， 对 于 抽象 等 级 这 一 维度 ， 我 们 将 其 分 成 了 
从 原生 到 整合 的 数 个 等 级 。 

抽象 等 级 为 “原生 ”的 API 所 展示 的 古 一 些 底层 的 组 件 。 如 来 想 用 原生 的 API 来 完成 任务 ， 
开发 人 员 将 需要 选择 一 些 原 生 的 组 件 并 相互 配合 着 来 达到 想 要 的 效 末 。 

例如 ， 原 生 的 文件 WO 的 API 就 可 能 把 文件 表示 为 一 个 流 。 要 从 流 中 读 取 数据 ，API 可 能 会 提 
供 一 个 StreamReader 类 。 开 发 人 员 需 要 组 合 使 用 这 些 类 ， 才 能 从 文件 中 读 取 数据 。 例 如 : 











O 关于 我 们 如 何 确立 这 三 种 角色 的 介绍 ， 参 见 参 考 文献 [2]。 
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File f = new File(); 

StreamReader sr = £.OpenFile("C:\test.txt"); 
Byte b = sr.Read(); 

String s = b.ToString(); 

f.CloseFile(); 


在 这 样 一 个 API 中 ， 开 发 人 员 需 要 知道 如 何 来 组 合 这 些 原生 组 件 来 达到 想 要 的 效果 (在 这 个 
例子 中 ， 从 文本 文件 中 读 取 数据 )。 

与 此 相反 的 是 ， 一 个 “整合 ”的 API 可 能 包含 了 一 个 代表 文本 文件 的 类 ， 并 提供 对 于 文本 文 
件 的 所 有 可 用 的 操作 。 例 如 


TextFile tf = new TextFile("C:\text.txt"); 
string s = tf.Read(); 
tf.Close(); 


在 定义 了 这 些 维度 的 评级 方法 之 后 , 我 们 使 用 了 从 多 用 性 人 研究 中 得 到 的 证 据 ， 来 确定 不 同 开 
发 人 员 角 色 对 于 不 同 易 用 性 维度 的 偏好 。 

在 确定 了 偏好 之 后 ， 我 们 回顾 了 每 次 研究 中 的 录像 以 及 观察 参与 者 对 不 同 API 的 使 用 情况 
由 于 在 征 盈 参与 者 的 面试 的 时 候 我 们 已 经 将 每 个 参与 者 都 和 角色 对 应 起 来 了 , 所 以 我 们 可 以 估计 
每 个 易 用 性 维度 的 角色 偏好 。 虽 然 我 们 并 没有 每 次 都 对 在 研究 中 观察 到 的 行为 做 量化 分 析 , 但 我 
们 仍然 确信 在 面试 时 对 于 开发 人 员 角 色 的 主观 判断 是 相当 准确 的 , 因为 我 们 此 前 对 此 做 了 很 多 研 

。 而 且 我 们 还 录 下 了 参与 者 在 进行 试验 时 的 解说 词 ， 这 些 常 第 使 得 他 们 的 角色 趋 咎 非常 明显 。 

我 们 观察 到 了 这 样 一 些 角 色 趋 问 ， 比 如 ， 节 机遇 型 的 开发 人 员 似乎 比较 喜欢 “整合 - dels 
TER o TM a St A FB I EM AE ee FAY EE AEB NEE ARRIE 分 
解 式 组 件 ” (factored components), ， 这 种 组 件 实际 上 就 是 把 整合 式 组 件 的 “模式 ”分 解 到 不 同 的 
组 件 中 。 

我 们 对 每 个 维度 都 一 一 进行 分 析 ， 直 到 我 们 为 每 个 开发 人 员 角 色 都 找到 了 一 套 对 应 的 偏好 。 
然后 我 们 将 这 些 数据 显示 在 了 图 29-1 中 。 
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领域 对 应 度 下 
角色 表现 力 LA 六 一 SK ` TIPER 
J) / 7 XK \ 一 一 机 遇 型 
一 致 性 HH HA 》 LIRR 一 务实 型 
\ \ \ | \ d / f | -之 - 系统 型 
过 早 的 承诺 ”一 | 一 渗透 性 





精细 化 
图 29-1 每 种 角色 对 于 认 知 维度 的 偏好 
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该 图 请 楚 地 表明 ， 每 种 角色 对 于 API 的 多 用 性 有 着 不 同 的 观点 。 机 遇 型 和 系统 型 的 开发 人 员 
所 偏好 的 抽象 等 级 的 区 别 ， 和 他 们 在 学 习 方 式 、 工 作 框架 的 区 别 相同 。 

在 微软 人 们 立刻 就 发 现 这 个 图 的 意义 所 在 : 要 想 设计 和 创造 一 套 可 以 同时 满足 三 种 不 同 角 色 
对 易 用 性 的 诉求 的 API， 即 便 有 可 能 ， 也 会 非 第 困难 。 但 这 里 就 有 个 大 问题 了。 大 部 分 设计 和 编 
写 API 的 团队 都 认为 ， 他 们 应 该 针对 所 有 三 种 角色 来 设计 API， 这 一 点 完全 正确 。 如 末 他 们 想 要 
每 种 角色 的 开发 人 员 都 能 舒服 地 使 用 他 们 的 API， 应 该 怎么 做 ? 他 们 应 该 为 每 种 角色 都 做 一 套 
APIO? 这 就 要 说 说 我 们 研究 的 最 后 一 步 一 一 基于 场景 的 设计 了 了 。 


基于 场景 的 设计 


当 我 们 提 到 API 这 个 词 的 时 候 ， 半 和 指 的 是 在 应 用 程序 和 程序 员 之 同形 成 接口 的 全 套 的 类 。 
换 句 话说， 每 个 开发 人 员 有 权 使 用 的 类 ,无论 他 是否 真正 使 用 ,都 被 视 为 是 API 的 一 部 分 。 当 API 
设计 团队 说 ， 他 们 想 要 创造 一 个 三 种 角色 的 开发 人 员 都 愿意 使 用 的 API 的 时 候 ， 团 队 假 设 这 些 开 
发 人 员 将 会 用 到 全 部 的 API。 

而 我 们 从 ATL Server 的 卡片 分 类 法 研究 中 已经 确定 API 的 易 用 性 并 不 是 由 分 析 API 中 的 所 有 
类 来 决定 的 。API 设 计 团 队 考 虑 的 征 全 套 的 类 ， 而 开发 人 员 只 会 想到 他 们 使 用 这 些 API 时 的 不 同 
场景 以 及 在 这 些 场 景 中 的 使 用 体验 。 

我 们 在 文件 VO 的 研究 中 实际 看 到 了 这 一 点 。 在 那 次 研究 中 ， 我 们 发 现 参 与 者 并 没有 化 心思 
去 了 解 .NET 框 架 中 的 每 一 个 类 。 相 反 ， 他 们 只 关注 那些 能 帮 他 们 完成 任务 的 类 。 此 外 ， 我 们 发 
现 他 们 忽略 了 一 些 不 符合 他 们 预期 抽 角 等 级 的 类 。 场 曲 ” 和 “预期 ”的 结合 帮助 第 选 出 了 他 们 
认为 有 用 的 类 。 

所 以 ， 解 决 API 在 三 种 角色 中 的 普遍 易 用 性 问题 的 重点 ， 就 在 于 使 用 API 的 场景 以 及 可 能 会 
在 这 些 场 景 中 进行 开发 的 开发 人 员 类 型 。 在 很 多 情况 下 , 场景 可 以 决定 开发 人 员 的 角色 类 型 ， 而 
我 们 也 就 能 确定 在 这 种 场景 下 应 该 使 用 哪 种 API 的 设计 方案 。 

为 了 演示 说 明 ， 我 们 可 以 考虑 一 下 一 个 通用 VO 的 API。 可 能 会 用 到 这 个 API 的 场景 包括 : 

O 从 文本 文件 中 读 取 一 行文 字 ; 

O 写 入 二 进 制 数 据 到 文件 ， 

O 执行 内 存 映 射 的 IO。 

要 说 三 种 角色 的 开发 人 员 都 会 涉及 所 有 这 些 场景 , 这 不 太 可 能 。 比如, 相 比 系统 型 开发 人 员 ， 
机 遇 型 开发 人 员 可 能 和 文本 文件 的 互动 更 多 , 因为 文本 文件 通 间 可 以 使 我 们 快速 地 建立 原型 和 进 
行 功 能 试验 〈 文 本 文件 可 以 由 文本 编辑 粥 快速 地 创建 和 修改 ， 所 以 要 做 测试 和 案例、 模拟 数据 等 ， 
都 很 简单 )。 

而 务实 型 开发 人 员 更 容 多 和 二 进 制 数据 打交道 , 因为 他 们 所 写 的 代码 和 硬盘 上 的 数据 有 着 更 
加 直接 的 对 应 关系 。 由 于 是 以 代码 为 重点 ， 务 实 型 开发 人 员 更 喜欢 那些 可 以 帮 他 们 减少 数据 表现 
形式 的 数量 的 框 染 。 

最 后 ， 系 统 型 的 开发 人 员 使 用 内 存 映射 文件 1/O 的 时 候 较 多 ， 因 为 在 这 样 的 抽象 程度 下 可 以 
更 灵活 。 比 如 ， 使 用 内 存 映射 的 VO， 他 们 可 以 在 多 个 进程 之 间 共 享 内 存 ， 还 能 对 内 存 的 访问 权 

















限 有 完全 的 控制 。 

在 这 个 简单 的 例子 里 ， 三 种 角色 确实 都 使 用 了 IO 的 API， 但 是 更 重要 的 是 ， 他 们 使 用 了 API 
的 不 同 部 件 。 我 们 可 以 根据 使 用 者 的 不 同 来 设计 这 些 部 件 。 比 如 , 文本 文件 相关 的 组 件 可 以 古 整 
合 型 的 ， 而 内 存 映 射 的 组 件 可 以 是 原 生 的 。 

在 基于 场景 的 设计 中 ，API 设 计 师 们 先 写 出 他 们 希望 开发 人 员 在 解决 菜 个 问题 场景 时 应 该 写 
的 代码 。 在 这 个 过 程 中 ， 他 们 需要 (用 认 知 维度 的 方法 ) 考虑 开发 人 员 的 偏好 。 也 就 是 说 ， 他 们 
会 把 上 自己 当 作 开发 人 员 ， 站 在 开发 人 员 的 立场 来 想 问 题 。 在 每 个 步 又 中 ，API 设 计 团队 都 可 以 使 
用 认 知 维度 框架 来 作为 一 个 检查 列表 , 来 确认 他 们 设计 的 路 线 是 否 正确 。 他 们 可 以 审阅 他 们 所 写 
的 每 个 代码 样 例 ， 以 确认 可 以 满足 开发 人 员 对 于 目标 场景 的 偏好 。 只 有 当 设 计 团队 已 经 对 这 个 问 
题 场景 的 解决 方案 很 满意 了 的 时 候 ， 他 们 才 开 始 设 计 和 创建 相应 的 API。 

当然 , 一 旦 进入 实现 阶段 ， 预 料 之 外 有 的 设计 回 题 就 会 出 现 。 在 这 些 情况 下 ,设计 团队 可 以 回 
顾 他 们 正在 创建 的 API 所 对 应 的 场景 ， 并 考虑 这 些 设计 问题 对 这 些 场 景 的 影响 。 只 要 这 样 做 ， 议 
计 团 队 就 可 以 真正 关注 多 API 的 用 户 体 验 ， 而 不 是 去 关心 整个 API 的 架构 。 只 要 能 努力 满足 各 种 
场景 五 化 八 门 的 API 和 需求 ， 那 在 整个 API 的 开发 过 程 中 ,就 可 以 基于 这 些 对 于 API 易 用 性 的 深入 理 
解 来 做 各 种 设计 决定 。 

一 个 基于 场景 的 设计 方法 是 让 API 设 计 师 去 思考 “API 征 做 什么 的 ， 而 不 是 “API 征 什么 。 
这 束 清 楚 地 表明 ， 设 计 师 所 设计 的 ， 古 开发 人 员 使 用 这 些 类 的 体验 ， 而 不 古 APIHNJ 整 体 染 构 。 当 
芳 虐 API 的 设计 的 时 候 ， 设 计 师 可 以 专注 于 API 的 使 用 场景 以 及 使 用 API 的 开发 人 员 类 型 。 











29.5 结论 


在 我 们 刚 开 始 研 究 API 多 用 性 的 时 候 ， 我 们 并 不 知道 这 个 研究 应 该 怎么 做 ， 也 不 知道 这 些 努 
力 是 否 值得 。 但 我 们 现在 可 以 毫 无 保留 地 说 ，API 的 易 用 性 研究 不 但 是 完全 可 能 ， 而 且 是 至 关 重 
要 的 。 关 于 不 同类 型 的 开发 人 员 对 API 的 使 用 方法 的 区 别 ， 以 及 他 们 对 于 API 的 预期 的 区 别 ， 我 
们 已 经 学 到 了 很 多 。 我 们 不 但 可 以 使 用 这 些 认识 来 设计 新 的 API， 还 可 以 解决 已 有 API 的 多 用 性 
问题 。 

例如 ， 基 于 场景 的 设计 方法 在 微软 已 经 使 用 了 几 年 了 了 7。 我们 的 API 设 计 准 则 和 审查 流程 更 加 
强调 了 API 的 易 用 性 研究 以 及 基于 场景 设计 “的 必要 性 。 

但 这 只 是 开始 。 还 有 很 多 事情 需要 做 。 由 于 在 API 正 式 发 布 之 前 找 出 API 的 易 用 性 问题 非常 
重要 ， 我 们 还 需要 研 究 更 多 的 方法 ， 以 帮助 我 们 在 API 开 发 过 程 中 尽早 地 发 现 多 用 性 的 问题 。 例 
如 ，Farooq 等 人 描述 了 一 种 评估 API 易 用 性 的 方法 ， 这 种 方法 无 需 易 用 性 研究 ”。 

同样 重要 的 是 ， 要 了 解 应 用 程序 开发 中 的 趋势 对 于 API 易 用 性 的 影响 。 例 如， 应 用 程序 开发 
中 有 一 种 使 用 设计 模式 (如 依赖 注入 ) 的 趋势 “。 对 于 采用 这 类 模式 ,在 架构 上 我 们 已 经 有 了 非 
前 明确 和 合理 的 理由 ， 但 征 这 些 模式 会 对 多 用 性 有 什么 影响 ”Jefft Stylos 调 查 了 这 些 问 题 ， 并 发 
现 某 些 流行 的 设计 模式 有 可 能 对 易 用 性 造成 惊人 的 影响 “中 。 

有 和 验 可 以 提出 并 回答 这 些 问 题 让 人 感觉 十 分 愉快 。 现 在 ， 我 已 经 加 入 VS 用 户 体验 团队 超过 
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10 年 了 ,我 能 体会 到 ， 关 于 如 何 提升 开发 人 员 的 用 户 体 验 ,我们 已 经 学 到 了 很 多 。 我 期 待 在 今后 
能 看 到 更 多 类 似 的 发 展 。 
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第 30 章 


“10 倍 ”意味 着 什么 ? 
编程 生产 力 的 差距 测量 


Steve McConnell 


在 软件 工程 研究 中 , 被 验证 得 最 多 的 结论 就 是 对 于 同等 经 验 的 两 个 不 同 程 序 员 , 在 效率 和 质 
量 上 可 能 会 有 10 倍 的 差距 。 人 研究 人 员 还 发 现 , 这 种 差距 也 适用 于 团队 级 别 上 ， 也 就 是 说 在 同一 行 
业内 的 不 同 的 团队 也 是 如 此 。 


30.1 软件 开发 中 的 个 人 效率 的 变化 


首先 发 现 不 同人 在 编程 生产 力 上 的 巨大 差距 的 研究 , 是 1960 年 由 Sackman、Erikson 以 及 Grant 
三 个 人 完成 的 “。 他 们 研究 了 工作 经 验 平均 在 7 年 的 专业 程序 员 ， 并 发 现 最 好 和 最 差 的 程序 员 写 
新 代码 的 时 间 比 为 20 : 1， 调 试 次 数 是 25 : 1; 程序 大 小 是 5 : 1; 程序 的 执行 效率 是 10 : 1。 他 们 
还 发 现 ， 程序 员 的 经 验 和 代码 质量 或 效率 并 没有 关系 。 

在 详细 地 研究 了 Sackman、Erickson 以 及 Grant 时 研究 结 东 之 后 ， 我 们 可 以 发 现 他 们 所 使 用 的 
方法 中 有 很 多 缺陷 ， 例 如 把 使 用 低级 程序 语言 和 高 级 程序 语言 的 程序 员 合 在 一 起 研究 等 。 但 是 ， 
即便 把 这 些 缺陷 旁 卡 进来 , 他 们 的 数据 也 仍然 表明 ,最 好 的 程序 员 和 最 差 的 程序 员 之 间 的 差距 能 
达到 10 倍 以 上 。 

那 次 研究 之 后 , 还 有 很 多 其 他 关于 专业 程序 员 的 相关 研究 都 证 明了 一 个 结论 : 程序 员 的 水 平 
也 分 三 六 九 等 (具体 内 容 参见 参考 文献 [6]、[11]、[9]、[7]、[5]、[2]、[1 和 和 [4])。 

除 些 之 外 ,很 多 轶 事 传闻 也 支持 这 种 观点 。 在 20 世 纪 80 年 代 中 期 ， 当 我 还 在 波音 公司 工作 的 
时 候 ， 有 个 约 80 个 程序 员 组 成 的 项 目 组 正面 临 着 无 法 按时 冤 成 一 项 关键 任务 的 风险 。 这 个 项 目 对 
于 波音 来 说 至 关 重 要 ， 所 以 他 们 把 项 目 上 80 个 人 中 的 一 大 半 换 成 了 男 外 1 个 人 ， 而 这 位 仁兄 单 枪 
匹 马 地 完成 了 所 有 的 编程 工作 ， 并 按时 交付 了 软件 。 我 并 疫 有 在 这 个 项 目 组 中 工作 ,也 不 认识 这 
位 天 才 ， 但 是 这 个 故事 是 一 位 我 所 信任 的 人 告诉 我 的 ， 所 以 我 相信 这 征 真 的 。 

这 种 差距 并 不 仅 限于 软件 行业 。Norm Augustine 的 一 份 研究 指出 , 在 各 行 各 业 中 , 包括 写作 、 
微 槛 球 、 发 明 、 警 务工 作 等 ， 都 存在 一 个 情况 ， 那 就 是 行业 中 位 列 前 20% 的 顶尖 人 才 的 产 出 占 到 300 




















424 第 30 章 “10 倍 ”意味 着 什么 ?编程 生产 力 的 差距 测量 


了 该 行业 总 产 出 的 50%， 无 论 这 些 产 出 是 得 分 、 专 利 、 侦 破 的 案件 还 是 软件 “。 你 可 以 想 想 看 ， 
这 还 是 有 道理 的 。 我 们 都 知道 ， 有 的 学 生 就 是 比 其 他 学 生 优秀 ， 运 动员 、 忆 术 家 其 至 家 长 也 是 如 
此 。 既 然 这 种 差别 存在 于 所 有 人 和 群 中 ， 那 么 软件 开发 又 怎么 会 例外 呢 ? 


30.1.1 巨大 的 差距 市 来 的 负面 影响 


Augustine 的 研究 发 现 , 由 于 有 些 人 完全 没有 任何 实质 的 页 献 (例如 不 能 得 分 的 前 锋 、 没 有 专 
利 的 发 明 家 、 无 法 破案 的 警 探 等 )， 人 与 人 之 则 的 差距 的 实际 情况 可 能 比 上 文 提 到 的 数据 还 要 大 。 

在 软件 行业 中 似乎 就 古 这 样 。 在 多 个 已 发 表 的 关于 软件 开发 效率 的 研究 项 目 中 ， 大约 有 10% 
的 实验 参与 者 无 法 完成 实验 任务 。 这 些 研 究 报 告 党 弟 会 这 样 说 道 :“ 所 以 我 们 从 数据 集中 排除 了 
这 些 参 与 者 的 结 末 。 但 是 在 现实 生活 中 ， 如 末 某 个 人 “无 法 完成 任务 "， 你 就 不 能 简单 地 “从 数 
据 集中 排除 他 们 的 结 末 ”了 。 你 或 者 得 等 他 们 完成 ， 或 者 得 另外 指派 一 个 人 完成 他 们 的 工作 ， 等 
等 。 这 里 有 一 个 有 趣 (而 又 可 怕 ) 的 暗示， 那 就 是 在 软件 行业 中 ， 差 不 多 有 10% 的 人 对 项 目 产 出 
的 贡献 征 负 数 。 

和 此 前 一 样 , 这 也 和 我 们 在 现实 生活 中 的 感受 一 致 。 我 相信 很 多 人 都 能 够 在 共事 过 的 人 中 找 
出 符合 这 个 摘 述 的 人 。 


30.1.2 什么 造就 了 真正 的 “10 EFA” 


很 多 人 并 不 喜欢 被 贴 上 “10 倍 ”这 样 的 标签 ， 因 为 他 们 觉得 人 们 会 说 :“ 我 们 团队 中 曾 有 个 
超级 程序 员 ， 他 和牛 哄 哄 的 ， 每 个 人 虱 不 愿 和 他 来 往 ， 要 是 没有 他 整体 效率 反而 还 要 高 些 。 

通常 来 说 ， 任 何 对 10 倍 程序 员 的 实用 定义 都 必须 考虑 这 样 的 程序 员 对 于 团队 其 他 人 员 的 影 
啊 。 我 也 知道 的 确 有 牛 哄 哄 的 超级 程序 员 。 但 更 多 的 时 候 ， 那 些 牛 哄 哄 的 超级 程序 员 其 实 只 是 普 
通 水 平 的 一 般 程序 员 而 已 , 其 至 还 达 不 到 普通 水 平 。 他 们 只 是 用 和 牛 哄 哄 的 外 表 来 让 目 己 的 表现 看 
上 去 不 那么 差 而 已 。 我 所 共事 过 的 真正 的 超级 程序 员 们 除了 技术 水 平 以 外 , 通 芝 还 有 很 好 的 团队 
精神 (虽然 有 时 也 有 些 例外 )。 


30.2 测量 程序 员 的 个 人 生产 力 的 问题 


由 于 很 多 人 研究 都 指出 不 同 程序 员 的 效率 可 以 有 10 倍 的 差 跑 ,导致 很 多 人 产生 了 一 个 想法 , Bf 
就 症 济 量 他 们 在 日 己 组 织 内 的 个 人 效率 。 无 论 如 何 ， 这 种 想法 所 涉及 的 测量 “ 活 的 ”程序 员 的 生 
产 力 和 一 般 研究 中 所 说 的 生产 力 有 很 大 不 同 。 

软件 工程 研究 通常 用 完成 杀 个 任务 所 需 的 时 间 、 每 小 时 或 每 个 月 能 写 多 少 行 代码 或 者 其 他 一 
些 祭 准 来 测量 生产 力 。 但 如 村 你 答 试 在 商业 环境 中 用 这 些 标准 来 测量 生产 力 , 那 就 会 磁 到 很 多 问题 。 


30.2.1 生产 力 = 每 月 产 出 的 代码 行 数 吗 
软件 设计 是 一 件 非 确定 性 的 事情 ， 对 同样 的 一 个 问题 ， 不 同 的 设计 师 / 开 发 人 员 会 做 出 完全 
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不 同 的 解决 方案 。 如 果 我 们 用 每 月 产 出 的 代码 行 数 (或 者 类 似 的 标准 ) 来 衡量 生产 力 ， 那 么 我 们 
就 默认 了 用 10 倍 的 代码 来 解决 同样 的 回 题 的 程序 员 束 有 10 倍 的 生产 力 。 显 然 事 情 并 韭 总 是 如 此 。 
比如 某 个 程序 员 可 能 会 有 一 个 绝妙 的 设计 想法 ,结果 只 用 10% 的 代码 就 解决 了 普通 程序 员 需 要 
100% 的 代码 才能 解决 的 问题 。 

有 人 曾 断 言 ,伟大 的 程序 员 写 的 代码 总 是 更 简短 。 事实 上 ,编程 水 平和 代码 的 简洁 性 之 间 可 
能 有 着 某 种 关联 ， 但 我 现在 并 不 想 做 这 样 一 个 宽泛 的 结论 。 我 只 想 说 ， 伟 大 的 程序 员 总 是 努力 把 
代码 写 得 更 清楚 ， 而 结果 通常 就 是 更 简短 的 代码 。 不 过 有 了 时候 ， 最 清楚 、 最 简单 和 最 明显 的 设计 
和 那些 更 “巧妙 ”的 设计 相 比 ， 需 要 更 多 一 点 的 代码 。 在 这 种 情况 下 ， 我 认为 伟大 的 程序 员 也 会 
用 稍微 多 一 点 的 代码 来 避免 太 过 于 取 巧 的 设计 。 无 论 怎 么 说 ， 用 “每 月 产 出 代码 行 数 ” 来 衡量 生 
产 力 的 想法 都 是 有 问题 的 。 

Dilbert? m PAPA: 老板 说 每 发 现 一 个 bug 束 奖励 10 块 线 ， 大 家 都 高 呼 这 次 赚 到 了 ， 
还 有 人 想 通 过 这 个 办 法 “ 写 出 辆 小 货车 ”来 "。 故 事 正好 说 明了 这 个 问题 ， 即 如 果 你 用 代码 的 产 
出 量 来 衡量 生产 力 ， 有 的 人 就 会 利用 这 一 点 ， 写 很 多 很 多 也 许 完 全 没有 必要 的 代码 。 这 里 的 问题 
并 不 在 于 “代码 量 ” 这 个 标准 ， 而 在 于 旧式 的 管理 思想 ， 即 “人 们 只 会 做 会 被 考察 的 事情 ”。 但 
你 必须 小 心 不 要 考察 错 东 西 。 


























30.2.2 生产 力 = 功能 点 吗 


每 个 月 的 代码 产 出 ”所 珊 来 的 问题 有 一 部 分 可 以 依靠 功能 点 的 标准 来 衡量 程序 规模 。 功 能 
扩 是 一 套 “ 合 成 ”的 测量 程序 大 小 的 标准 。 包 括 输 入 、 输 出 、 查 询 、 文 件数 量 每 都 被 性 虑 进来 ， 
作为 确定 程序 大 小 的 参数 。 低 效 的 设计 /编程 风格 并 不 能 产生 更 多 的 功能 点 ， 所 以 功能 氮 这 个 标 
准 不 涉及 代码 量 的 问题 ,但 是 它 却 有 一 个 更 实际 的 问题 , 那 就 是 你 需要 专业 人 士 来 计算 功能 点 (很 
多 公司 并 无 这 种 人 才 )， 而 且 功 能 点 和 个 人 产 出 的 对 应 也 非常 粗略 ， 所 以 无 法 用 于 确定 程序 员 的 
个 人 生产 力 。 





30.23 复杂 度 呢 
管理 者 常 说 :“ 我 总 是 把 最 困难 、 最 复杂 的 编程 任务 交 给 最 好 的 程序 员 去 做 。 所 以 无 论 用 什 
么 方法 来 衡量 ,他 的 生产 力 好 像 总 是 比 别人 低 , 但 是 如 果 同 样 的 事情 让 别人 来 做 , 就 可 能 花 上 两 
倍 的 时 间 。” 这 种 现象 很 正常 ， 但 是 也 会 影响 我 们 定义 和 测量 生产 力 的 方式 。 
30.2.4 到 底 有 没有 办 法 可 以 测量 个 人 生产 力 
前 文 提 到 的 这 些 困难 让 很 多 人 认为 : 要 想 测 量 个 人 生产 力 简直 困难 重重 ， 没 人 可 以 做 到 。 但 
我 认为 要 想 正 确 地 测量 个 人 生产 力 是 可 能 的 ， 只 是 需要 注意 以 下 几 点 。 
e0000000000000000000000000000000 


®© 见 http:/dilbert.comy/strips 人 comic/199$-11-13/。 一 -一 译 者 注 
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你 可 以 参照 一 下 那些 在 体育 比赛 中 搜集 的 统计 数据 。 我 们 甚至 无 法 用 一 个 单独 的 标准 来 确 

定 棒球 比赛 中 击 球 手 的 水 平 。 我 们 必须 考虑 打击 率 、 全 又 打 、 跑 又 得 分 、 上 鲍 率 以 及 其 他 种 种 

因素 。 而 且 仅 有 这 些 数据 还 不 够 ， 我 们 还 得 去 证 明 这 些 数据 的 意义 。 如 果 击 球 手 的 优 劣 无 法 用 

简单 的 标准 来 评 断 的 话 ， 难 道 程序 员 的 个 人 生产 力 这 样 复杂 的 事情 就 可 以 吗 ? 我 们 应 该 用 的 不 

是 一 个 单独 的 标准 ， 而 是 一 整套 标准 的 组 合 。 这 套 组 合 标准 的 任务 ， 就 是 让 我 们 对 个 人 生产 力 

有 更 深入 的 了 解 。 比 如 ， 这 套 标准 可 能 包括 准时 完成 任务 的 百分比 、 管 理 者 的 评分 1~ 10、 同 

事 的 评分 1~ 10、 每 个 月 产 出 的 代码 行 数 、 每 行 代码 的 平均 缺陷 数量 、 不 当 修 复 的 比率 ， 等 等 。 

e00000000000000000000000000000000000000 

0000 
要 记 住 一 点 : 这 些 个 人 生产 力 的 标准 只 是 为 你 找 出 问题 ， 但 是 并 不 会 回答 这 些 问题 。 对 

这 些 标准 的 不 当 使 用 ， 比 如 用 来 进行 绩效 评估 ， 不 但 会 带 来 管理 上 的 问题 也 会 造成 统计 上 

的 问题 。 

e Q000000000000000000000 

将 这 些 测量 结果 在 不 同 个 体 间 进行 横向 比较 往往 是 得 不 出 任何 有 意义 的 结论 的 。 更 有 用 

的 做 法 应 该 是 将 某 个 人 的 测量 结果 进行 纵向 分 析 ， 看 看 这 个 人 有 没有 随 着 时 间 的 推移 而 进 

步 。 

。00000:0000000o0000000 

在 研究 环境 中 ,研究 员 们 需要 评估 不 同 技术 的 效率 ,所 以 需要 测量 个 人 生产 力 。 相 对 于 
研究 环境 , 在 现实 项 目 中 使 用 同样 的 测量 标准 产生 的 问题 就 要 多 得 多 了 。 在 现实 项 目 环境 中 ， 

你 想 要 用 这 些 测量 标准 来 做 什么 ?绩效 评估 ? 这 主意 不 行 , 原因 刚刚 才 说 过 。 分 配 任务 ? 但 

我 所 访问 过 的 大 部 分 管理 者 都 说 他 们 不 必 测 量 也 知道 谁 是 他 们 团队 中 的 明星 成 员 , 这 一 点 我 

也 相信 。 做 预算 ? 不行， 不同 设计 方法 导致 的 差距 、 不 同 的 任务 难度 以 及 其 他 相关 的 原因 使 

得 我 们 无 法 有 效 利 用 这 些 标准 来 做 项 目 预算 。 

在 现实 项 目 中 ， 个 人 生产 力 的 标准 很 难 找到 一 个 对 项 目 管理 有 益 而 又 符合 统计 学 规则 的 用 
处 。 根 据 我 的 经 验 ,除了 做 研究 之 外 ， 人 们 想 对 个 人 效率 进行 测量 的 动机 通常 来 自 一 些 在 统计 学 
上 不 能 成 立 的 结论 。 也 就 是 说 ， 虽 然 我 知道 在 研究 中 对 个 人 效率 的 测量 非常 有 意义 ,但 是 我 认为 
在 实际 项 目 中 却 很 难 找到 它 的 合理 用 处 。 


30.3 ”软件 开发 中 的 团队 生产 力 委 嘴 


软件 专家 们 很 早 就 已 经 发 现 , 团队 生产 力 的 差 中 和 个 人 生产 力 的 差距 一 样 大 , 是 以 数量 级 为 
单位 的 “。 这 里 有 一 部 分 原因 是 因为 物 以 类 聚 ， 人 以 群 分 ,这 一 点 已 经 由 一 次 对 来 自 18 个 组 织 机 
构 的 166 个 职业 程序 员 的 研究 证 明了 “”。 

又 比如 ， 在 一 次 对 7 个 完全 相同 的 项 目的 研究 中 ， 人 研究 人 员 发 现 ， 在 这 些 团 队 中 耗 避 精力 最 多 
的 是 最 低 的 3.4 倍 ， 而 对 于 程序 的 大 小 ， 最 大 的 是 最 小 的 3 倍 ”“。 虽 然 生产 力 有 一 定 差距 ， 但 是 这 次 
研究 中 的 程序 员 都 来 自 相 似 的 背景 。 他 们 都 是 科 班 出 身 的 职业 程序 员 ,， 而 且 都 有 多 年 的 经 验 。 我 们 
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可 以 合理 地 推测 ， 如果 研究 对 象 的 背景 差异 再 大 一 些 , 那么 他 们 之 间 的 差距 会 更 大 。 早 期 的 一 份 对 
编程 团队 的 研究 曾 指 出 , 对 于 同样 的 项 目 , 不 同 团队 所 提交 的 程序 大 小 的 比例 可 以 达到 5 : 1, 而 所 
需 时 间 的 比例 可 以 达到 2.6 : 1 。 

Barry Boehm 等 研究 人 员 为 了 确立 COCOMO I 成 本 估算 模型 而 研究 了 超过 20 年 的 数据 ， 并 总 
结 到 : 对 于 同样 的 程序 ， 能 力 评分 在 15+ 的 团队 需要 的 时 间 是 得 分 为 90+ 的 团队 的 3.5 倍 〈 以 100 分 
算 )。 如 果 一 个 团队 比 另 一 个 团队 在 程序 语言 或 者 应 用 领域 上 更 有 经 验 ， 那 么 这 个 差距 还 会 更 大 。 

一 个 具体 的 例子 就 是 Lotus 1 ~2~3 第 三 版 和 微软 Excel 3.0 开 发 团队 之 间 的 生产 率 差 距 。 两 者 
都 是 在 1989 一 1990 这 个 时 间 段 发 布 的 桌面 电子 表格 应 用 程序 。 由 于 很 少 看 到 两 个 公司 公布 相似 项 
目的 数据 ， 所 以 这 种 死对头 之 间 的 对 比 就 显得 尤其 有 趣 了 。 这 两 个 项 目的 数据 如 下 : Excel 的 工 
作 人 员 总 共 消 耗 了 50 个 工 年 “， 共 写 了 649 000 行 代码 “。 而 Lotus 1 一 2 一 3 消耗 了 260 个 工 年 ， 共 
写 了 400 000 行 代码 。Excel 的 团队 每 个 工 年 的 代码 产 出 是 13 000 行 代码 。 而 Lotus 的 团队 每 个 工 
年 的 产 出 上 只 有 1500 行 代码 。 两 个 团队 之 间 的 生产 力 差距 超过 了 8 倍 , 正好 证 明了 我 们 此 前 的 主张 ， 
即 团队 的 生产 力也 有 差距 ， 并 且 有 着 更 大 量 级 的 差距 。 

有 趣 的 是 , 这 些 量化 的 结果 和 局 外 人 对 于 这 些 项 目的 感觉 非常 贴近 。Lotus 123 第 三 版 当时 是 
出 了 名 的 跳 票 王 ， 比 预期 的 时 间 至 少 晚 了 两 年 才 发 布 。 而 在 微软 内 部 ，Excel 大 受 赞扬 ， 被 誉 为 
是 微软 最 成 功 的 项 目 之 一 。 对 于 真实 公司 的 真实 项 目 , 这 种 程度 的 同类 比较 恐怕 已 经 是 能 做 到 的 
极致 了 。 

如 前 所 述 ， 这 个 例子 说 明了 造成 生产 力 差 距 的 各 种 因素 。Lotus 和 微软 都 仇 费 苦心 地 为 各 自 
的 项 目 招募 了 顶级 的 人 才 , 所 以 我 怀疑 团队 生产 力 的 差距 并 不 只 是 由 于 团队 成 员 的 能 力 差距 造成 
的 , 还 牵扯 到 了 很 多 组 织 结 构 上 的 因素 ， 比 如 产品 远景 是 否 清楚 、 客 户 需 求 是 否 明确 以 及 成 员 之 
间 是 否 能 同心 协力 ， 等 等 。 

组 织 的 因素 会 影响 团队 生产 力 的 发 挥 。 杰出 的 组 织 中 个 人 能 力 平庸 的 团队 可 以 超越 平庸 组 织 
中 个 人 能 力 杰 出 的 团队 。 当然, 像 杰出 的 组 织 + 杰 出 的 团队 或 者 平庸 的 组 织 + 平 庸 的 团队 这 样 的 组 
合 也 不 是 没有 的 。 在 这 种 时 候 ， 团 队 生 产 力 (或 者 叫 组 织 生 产 力 ) 和 个 人 生产 力 一 样 相差 10 倍 也 
WELD BAY Lo 
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Jorge Aranda 是 维多利亚 大 学 的 博士 后 研究 员 ， 在 SEGAL 和 CHISEL 实 验 室 工作 。 他 之 前 在 
多 伦 多 大 学 拿 到 了 博士 学 位 ， 学 位 研究 包含 对 几 十 家 软件 组 织 的 数 百 名 专业 人 士 进行 的 实证 研 
究 、 观 察 和 访谈 。 这 些 研究 ， 以 及 他 之 前 作为 软件 和 咨询 师 和 开发 者 的 经 验 ， 使 他 相信 团队 协作 和 
团队 交流 是 我 们 领域 中 最 严重 的 问题 , 而 他 的 研究 也 旨 在 解决 这 些 问题 。Jorge 是 加 拿 大 不 列 颠 可 
伦比 亚 省 维多利亚 市 的 墨西哥 人 ， 与 他 的 妻子 和 他 们 的 猫 生 活 在 一 起 。 他 喜欢 桌 游 、 阅 读 、 看 电 
影 、 京 饰 、 跑 步 和 变 戏 法 。 





Thomas Ball 是 微软 研究 院 的 首席 研究 员 ， 他 管理 着 软件 可 靠 性 研究 小 组 (http://research. 
microsoft.com/srr/ ) 。Iom 在 1993 年 拿 到 了 威斯康星 大 学 考 迪 进 分 校 的 博士 学 位 。1993 年 ~1999 人 年， 
他 在 贝尔 实验 室 工 作 。 自 1999 年 起 , 他 一 直 在 微软 研究 院 。 他 是 SLAM 项 目的 发 起 者 之 一 , SLAM 
是 一 个 针对 C 语 言 的 软件 模型 检查 引擎 ， 构 成 了 静态 驱动 程序 验证 工具 的 基础 。Tom 兴 趣 广 泛 ， 
从 程序 分 析 、 模 型 检查 、 测 试 ， 到 用 自动 化 定理 证 明定 义 及 度量 软件 质量 的 问题 。 


Victor R. Basili 博 士 是 马里 兰 大 学 计算 机 科学 院 的 教授 。 他 是 弗 劳 恩 霍 夫 (Fraunhofer) 实验 性 
软件 工程 中 心 的 创始 主任 ， 现 在 他 担任 资深 研究 员 ， 也 是 NASA/GSFC 软 件 工 程 实验 室 (SEL) 的 
创始 人 和 主任 之 一 。 在 过 去 超过 35 年 的 时 间 中 ， 他 用 实证 研究 中 观察 和 进化 知识 的 机 制度 量 、 评 估 
并 改善 软件 开发 的 流程 和 产品 。 比 如 ,，“ 目 标 一 问题 一 指标 ”法 、 质 量 改 进 疙 例 、 以 及 经 验 工 厂 。 

Basili 博 士 在 德 殉 联 斯 大 学 拿 到 了 计算 机 科学 博士 学 位 ， 也 得 到 了 两 个 索 誉 学 位 。 他 曾经 得 
到 过 ACM SIGSOFT、IEEE 计 算 机 学 会 、NASA 等 机 构 的 奖励 。 在 2005 年 ， 第 27 界 国际 软件 工程 
大 会 为 他 举办 了 一 次 研讨 会 。2007 年 ， 他 歼 得 了 弗 艺 恩 霍 夫 (Fraunhofer) 奖章 。 他 是 IEEE 
Transactions on Software Engineering (《IEEE 软 件 工程 会 刊 》) 的 主编 ， 也 是 Journal of Empirical 
Software Engineering (《 实 证 软件 工程 杂志 》) 的 共同 创始 主编 。 





Andrew Begel 走 微软 研究 院 “ 编 程 中 的 人 际 交 互 ” 小 组 的 研究 员 ， 位 于 美国 华盛顿 雷 德 之 。 
他 人 猎 究 微 软 的 软件 工程 师 ,， 试图 理解 他 们 如 何 交 流 、 合 作 、 协 调 ,以 及 这 些 活动 对 同 地 和 异地 开 
发 效 示 的 影响 。 研 究 之 后 ， 他 会 构建 工具 来 减轻 他 们 所 发 现 的 协调 问题 。Andrew 引 导 过 多 个 工 
作坊 ,包括 软件 工程 中 人 文 因素 、 计 算 机 教育 中 的 动 沉 学习 、 对 计算 机 教学 进行 培训 以 及 复杂 系 
统 科 学 。 他 在 许多 计算 机 科学 和 计算 机 科学 教育 相关 的 大 会 和 工作 坊 中 担任 程序 委员 会 成 员 。 
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Christian Bird 是 微软 研究 院 实 证 软件 工程 小 组 的 博士 后 研究 员 。 他 对 大 型 开发 项 目 中 软件 设 
计 和 社会 动态 的 关系 ， 以 及 它们 对 生产 力 和 软件 质量 的 影响 最 感 兴趣 。 为 了 实证 性 地 回答 那个 领 
域 的 问题 ，Bird 博 士 开 创 了 一 系列 软件 挖掘 技巧 。 他 研究 过 微软 、IJBM 和 开源 领域 的 软件 开发 团 
队 ， 检 验 分 布 式 团队 、 所 有 权 政 策 、 以 及 团队 完成 软件 任务 的 方式 所 产生 的 影 啊 。 

Bird 博 士 是 ACM SIGSOFT 优 秀 论文 奖 的 获得 者 ， 以 及 加 州 大 学 戴 维 斯 分 校 “ 节 佳 研究 生 研 
客 员 ” 称 志 获得 者 。 而 他 的 博士 学 位 也 是 在 加 州 大 学 戴 维 斯 分 校 获 得 的 ， 寻 师 征 Prem Devanbu。 
他 在 顶尖 软件 工程 学 术 会 中 引起 过 人 们 的 注意 , 在 CACM 中 有 著名 的 研究 成 来, 也 是 BYU 的 国家 
优秀 学 者 。BYU 也 古 他 拿 到 计算 机 科学 学 士 学 位 的 地 方 。 








Barry Boehm 博 士 是 丙 加 利 福 尼 亚 大 学 计算 机 科学 和 工程 及 系统 工程 部 的 TRW 教 授 。 他 也 是 
DoD-Stevens-USC 系 统 工程 研究 中 心 的 研究 主任 ， 及 USC 系 统 及 软件 工程 中 心 的 创始 主任 名 誉 教 
授 。 他 在 1989~1992 年 是 DARPA-ISTO 的 主任 ，1973 年 一 1989 年 是 ITRW 的 主任 ，1959 年 一 1973 年 
是 Rand 公 司 的 主任 ，1955~1959 年 是 General Dynamics 的 主任 。 他 的 贡献 包括 COCOMO 家 族 的 成 
本 模型 和 螺旋 家 族 的 流程 模型 。 他 是 各 主要 专业 协会 的 资 这 委 员 ， 包 括 计 算 (ACM)、 航 空 
(AIAA) 、 电 子 (IEEE)、 系 统 工程 (INCOSE)。 他 是 美国 国家 工程 院 院 士 ， 并 由 于 在 系统 工程 
和 系统 科学 领域 的 杰出 页 献 在 2010 年 获得 了 IEEE 的 Simon Ramo T , 


Marcelo Cataldo 是 卡 内 基 梅 隆 大 学 软件 研究 学 院 的 研究 员 。 他 的 研究 重点 在 理解 大 规模 软 
件 系统 的 结构 和 开发 组 织 实现 那些 系统 的 能 力 之 间 的 关系 。 调 查 的 具体 领域 包括 : (1) 开发 和 分 
析 适 用 于 分 布 式 软件 开发 的 软件 架构 ;，(2) 评估 技术 因素 、 社 会 组 织 因 素 、 及 其 之 间 的 相互 作用 
对 分 布 式 项 目 开发 生产 力 和 软件 质量 的 影响 。Cataldo 博 士 2007 从 卡 内 基 梅 隆 大 学 计算 机 科学 院 获 
得 了 “计算 、 组 织 和 社会 ”的 硕士 和 博士 学 位 。 他 也 握 有 国家 技术 大 学 (阿根廷 不 宜 诺 斯 艾 里 斯 ) 
信息 系统 学 士 学 位 ， 以 及 卡 内 基 梅 隆 大 学 信息 网 络 硕士 学 位 。 











Steven Clarke 是 微软 开发 部 的 资深 用 户 体验 人 研究员。 他 在 1993 年 和 1997 年 分 别 获得 了 了 苏 格 
兰 格拉 斯 哥 大 学 的 硕士 和 博士 学 位 。1997 年 ~1999 年 ， 他 古 靡 托 罗拉 的 软件 开发 人 人员， 构建 智能 
卡 操 作 系 统 的 开发 工具 。 他 从 1999 年 开始 工作 于 当前 的 职位 。 他 与 Visual Studio 和 微软 研究 院 的 
同事 们 一 起 , 使 用 针对 开发 习惯 和 工作 风格 的 研究 结果 , 来 识别 能 大 幅度 提升 开发 者 用 微软 的 工 
具 和 平台 构建 应 用 程序 的 用 户 体 验 的 方式 。 


Jason Cohen 创 办 了 四 家 公司 ， 包 括 Smart Bear 软 件 公 司 ， 该 公司 制造 了 最 流行 的 同行 代码 
审查 工具 Code Collaborator。 他 也 是 Best Kept Secrets of Peer Code Review 有 的 作者 ， 书 中 包含 了 在 录 
的 最 大 的 代码 审查 案例 。 现 在 ，Jason 在 http://blog.ASmartBear.com 为 极 客 们 写 创业 相关 的 文章 ， 
也 正在 运 党 他 最 新 创办 的 公司 WPEngine.com。 


Robert Deline 是 微软 研究 院 的 首席 研究 员 (http://research.microsoft.com/~rdeline) ， 工 作 于 软 
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件 工程 和 人 机 交互 的 交叉 领域 。 他 的 研究 团队 用 以 用 户 为 中 心 的 方式 设计 开发 工具 : 他 们 研究 开 
发 团队 来 理解 他 们 的 工作 实践 并 打造 新 的 工具 原型 来 改善 那些 实践 。 他 在 1999 年 从 卡 内 基 梅 隆 
学 获得 了 博士 学 位 ，1993 年 从 弗吉尼亚 大 学 获得 了 学 士 和 侦 士 学 位 。 


Madeline M. Diep shay Age (Fraunhofer) 中 心 实验 软件 工程 的 研究 科学 家 。 她 的 研究 
重点 包括 软件 质量 保障 、 软 件 分 析 和 实证 评 佑 。 她 从 内 布 拉 斯 加 大 学 林肯 分 校 歼 得 了 计算 机 科学 
博士 学 位 。 





Hakan Erdogmus 是 加 拿 大 凑 太 华 的 独立 咨询 帅 ， 卡 尔 加 里 大 学 计算 机 科学 院 的 辅助 教员 ， 
IEEE 软 件 的 主编 。 他 的 专长 是 软件 流程 、 软 件 开 发 实践 以 及 软件 开发 的 经 济 学 。1995~2009 年 ， 
他 十 加 拿 大 国家 研究 理事 会 的 信息 技术 研究 所 的 研究 科学 家 。Hakan 拥 有 论 特 利 尔 鬼 北 殉 大 学 
INRS 电 信 专 业 的 博士 学 位 《1994) ， 察 特 利 尔 麦 吉尔 大 学 计算 机 科学 院 的 硕士 学 位 〈1989)， 伊 
斯 坦 布 尔 博 阿 齐 奇 大 学 计算 机 工程 部 的 学 士 学 位 (1986)。 他 是 IEEE 和 IEEE 计 算 机 学 会 的 资深 会 
员 ， 也 十 ACM 和 敏捷 联盟 的 会 员 。 





Michael W. Godfrey 征 加 拿 大 和 请 铁 万 大 学 计算 机 科学 David R. Cheriton 学 院 的 副教授 , 他 也 古 
软件 染 构 小 组 SWAG 的 成 员 。 在 獒 得 多 伦 多 大 学 计算 机 科学 博士 学 位 后 ,他 在 康 奈 尔 大 学 做 了 两 
年 教员 ， 然 后 在 1998 年 加 入 了 清 铁 万 大 学 。 在 2001 年 到 2006 年 间 ， 他 在 北 电 和 加 拿 大 国家 科学 与 
工程 研究 理事 会 (NSERC) 资助 的 电信 软件 工程 院 任 工业 研究 副 主 席 。 他 的 研究 重点 涉及 软件 
的 进化 : 理解 软件 如 何 随 着 时 间 变 化 以 及 为 什么 。 他 对 循 证 软件 工程 、 软 件 殉 隆 分 析 、 挖 掘 软件 
知识 库 、 软 件 工具 设计 、 逆 同 工 程 和 程序 理解 特别 感 兴 趣 。 


Mark Guzdial 是 乔治 亚 理 工学 院 交互 计算 学 院 的 教授 。 他 是 计算 机 教学 的 主要 研究 者 ， 帮 助 
把 计算 机 科学 教育 的 需求 从 仅仅 针对 计算 机 专业 转向 了 应 对 整个 校园 。 最 近 他 写 了 一 系列 名 为 
《媒体 计算 》 的 教科 书 ， 通 过 处 理 数 字 媒 体 来 介绍 计算 。 


JoFE.Hannay 拥 有 爱丁堡 大 学 计算 机 科学 基础 的 实验 室 逻 辑 、 形 式 规 沁 和 类 型 理论 的 博士 学 
位 。 他 目前 是 挪 威 Simula 研 究 实验 室 的 研究 员 。 他 曾经 在 保险 行业 做 过 程序 员 ， 也 在 奥斯陆 大 学 
做 过 副教授 。 他 的 研究 内 容 包 括 定 义 软件 工程 的 专业 技术 和 任务 、 开 发 并 合并 科学 和 实践 理论 、 
以 及 理解 大 型 敏捷 开发 项 目 中 发 生 了 些 什 么 。 他 曾经 生 一 名 小 提 蕉 演 芝 家 。 











Ahmed E. Hassan 是 加 拿 大 安大略 省 金 斯 顿 星 后 大 学 超大 规模 系统 软件 工程 部 的 NSERC/RIM 
工业 研究 主席 。Hassan 博 士 牵 头 组 织 并 创立 了 挖掘 软件 仓库 (MSR) 大 会 以 及 相关 的 研究 社区 。 
MSR 社 区 则 在 用 软件 项 目 及 其 演进 过 程 中 的 实证 数据 来 支持 决策 流程 。Hassan 博 士 共 同 主编 了 
《IEEE 软 件 工程 会 刊 》 和 《实证 软件 工程 杂志 》 中 关于 MSR 话 题 的 特刊 。 
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Hassan 博 十 及 其 团队 所 开发 的 所 有 工具 和 技术 都 已 集成 于 全 球 上 百 万 人 使 用 的 产品 中 。 
Hassan 博 士 的 产业 经 营 包 括 ; 帮助 RIM 的 黑莓 无 线 平台 搭建 架构 ， 工 作 于 IBM 研 究 院 阿尔 马 登 实 
验 室 , 工作 于 北 电网 络 的 计算 机 研究 实验 室 。Hassan 博 士 拥 有 全 球 好 几 个 地 区 的 专利 , 包括 美国 、 
欧洲 、 印 度 、 加 拿 大 和 日 本 。 


Isreal Herraiz 是 西班牙 马德里 智者 阿 方 索 十 世 大 学 (Universidad Alfonso X el Sabio) 任教 并 
进行 研究 。 他 在 GSyC/Libresoft 研 究 小 组 工作 的 同时 ,从 胡 安 卡 洛斯 国王 大 学 (Universidad Rey Juan 
Carlos) 获得 了 博士 学 位 。 他 的 研究 重心 在 软件 演进 、 挖 抉 软 件 仓库 、 实 证 软件 工程 的 交集 上 ， 
侧重 于 软件 项 目的 大 规模 研究 和 统计 分 析 。 他 同时 也 是 好 几 个 免费 开源 软件 项 目的 活跃 页 献 者 。 


Kim Sebastian Herzig 是 德国 院 尔 大 学 (Saarland University) 软件 工程 实验 室 Andreas Zeller 
教授 手下 的 研究 后 。 他 当前 的 研究 活动 重点 是 实证 软件 工程 和 挖掘 软件 仓库 。 他 正在 探索 和 分 析 
版 本 归档 和 缺陷 数据 库 来 创建 能 帮助 软件 开发 者 开发 可 徘 的 软件 并 能 够 估计 源 代 码 改 变 风 险 的 
工具 和 技巧 。 








Cory Kapser 已 经 发 布 了 关于 编码 实践 的 众多 文章 ， 特 别 是 关于 代码 克隆 的 文章 。 他 甩 得 了 
2006 年 党 13 届 IEEE 逆 向 工程 工作 会 议 的 最 佳 文章 奖 。 








Barbara Kitchenham 是 英国 基 尔 大 学 定量 软件 工程 的 教授 。 她 在 软件 工程 的 产业 和 学 术 领域 
已 经 工作 了 超过 30 年 。 她 的 主要 研究 重点 是 软件 度量 及 其 在 项 目 管理 、 质 量 控制 、 风 险 管理 和 软 
件 技术 评估 中 的 应 用 。 她 最 近 的 研究 侧重 于 把 基于 证 据 的 实践 应 用 于 软件 工程 。 她 是 一 位 特许 数 
学 家 、 数 学 及 应 用 数学 研究 所 的 研究 员 、 皇 家 统计 学 会 研究 员 、 以 及 IEEE 计 算 机 学 会 成 员 。 


Andrew Ko 是 华盛顿 大 学 信息 学 院 的 副教授 。 他 的 研究 方向 包括 软件 开发 设计 中 人 与 合作 的 
方面 更 广泛 地 说 ,是 人 机 交互 和 软件 工程 领域 。 他 所 发 布 的 文章 涵盖 了 所 有 这 些 领域 。 他 曾 获 
得 过 顶级 会 议 的 最 佳 文章 奖 ,比如 软件 工程 国际 大 会 (ICSE) 及 ACM 计 算 中 的 人 性 因素 大 会 (CHI) 
等 。 他 所 开发 的 调试 工具 Whyline 也 得 到 了 众多 的 点 击 ， 它 允许 用 户 在 遇 到 问题 输出 时 ， 能 够 间 
“为 什么 "。2004 年 ,他 同时 获得 了 NSF 和 NDSBG 研 究 奖学金 以 支持 他 的 博士 研究 。 他 在 Brad Myers 
的 指导 下 从 卡 内 基 梅 隆 大 学 人 机 交互 学 院 获 得 了 博士 学 位 。2002 年 ,他 从 俄勒冈 州立 大 学 计算 机 
科学 和 心理 学 院 获得 了 荣誉 理学 学 位 。 





Lucas Laymanze #877, GES (Fraunhofer) 实验 性 软件 工程 中 心 的 研究 科学 家 。 他 的 专长 领 
域 包括 把 度量 和 指标 运用 于 评估 和 提升 软件 开发 流程 和 产品 、 敏 捷 方 法 和 软件 可 靠 性 。 他 在 好 几 
个 组 织 中 进行 过 实证 研究 和 技术 转移 ， 包 括 NASA、 微 软 、 国 防 部 、IBM 和 Sabre 般 空 解决 方案 。 
除了 实证 评估 流程 和 流程 改进 之 外 ，Layman 博 士 也 调研 了 软件 开发 中 的 人 性 因素 并 在 计算 机 科 
学 教学 领域 发 表 了 几 态 论文 。 他 在 2009 年 从 北 卡罗来纳 州立 大 学 获得 了 计算 机 科学 博士 学 位 ， 
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2002 年 从 Loyola 学 院 获 得 了 计算 机 科学 学 士 学 位 。 他 也 曾 在 微软 研究 院 和 加 拿 大 国家 研究 理事 会 
工作 过 o 


Steve McConnell 是 Construx 软 件 公司 的 CEO 和 首席 软件 工程 师 ， 他 对 各 行业 提供 咨询 、 在 
人 研讨 会 上 授课 、 并 监管 Construx 软 件 公 司 的 工程 实践 。 他 是 So1jphpare Estimation: Demystifying the 
Black Art (2006) , Rapid Development (1996) , Software Project Survival Guide (1998) 和 Professional 
Software Development (2004) 的 作者 ， 也 发 表 了 众多 科技 文章 。 他 的 书 在 软件 开发 杂志 、 游 戏 开 
发 杂志 、 亚 马 进 主 编 和 其 他 地 方 获 得 了 多 次 “年 度 最 佳 书籍 奖 。 

Steve 是 IEEE 软 件 杂 志 的 名 誉 主编 ,SWEBOK 的 专家 小 组 成 员 ， 也 是 IEEE 计 算 机 学 会 专业 实 
务 委员 会 的 上 任 主席 。1998 年 , 《软件 开发 》 杂 志 把 他 和 Bil Gates 和 Linus Torvalds 一 起 推选 为 3 
个 软件 行业 最 有 具 影 响 力 的 人 物 。 








Tim Menzies 征 西 弗 吉 尼 亚 大 学 计算 机 科学 院 的 副教授 ， 研 究 软件 工程 的 数据 挖掘 算法 。 他 
的 算法 可 以 找到 软件 工程 数据 中 的 模式 来 预测 软件 质量 方面 的 问题 (缺陷 、 构 建 时 间 等 )。 他 的 
工作 被 经 第 性 地 总 结 为 “ 少 即 是 多 ”，AI 推 动工 具 可 以 快速 自动 地 学 习 最 少 的 约束 条 件 最 大 程度 
ROMA BEEK o 

NASA HI EER E Menzies H EAA KA) Tt ARREK FIA TEREE AA 
(1995)。 他 是 超过 190 篇 被 经 第 引用 的 文章 的 作者 ，PROMISE 软 件 工程 重复 实验 系列 大 会 的 共同 
创始 人 (http://promisedata.org/data )。 最 近 ， 他 在 超过 26000 位 软件 工程 研究 者 中 被 排名 为 最 优秀 
的 1% (http://academic.research.microsoft.com/CSDirectory/author category 4 last$.htm)。 他 的 网 站 


是 : http://menzies.us。 


Gail Murphy KRECEK (UBC) 计算 机 科学 院 的 教授 。 她 在 1996 年 获得 了 华盛顿 
大 学 的 硕士 和 博士 学 位 之 后 加 入 了 UBC。 在读 人 研究 生 之 前 ， 她 在 一 家 电信 公司 作 了 5 年 软件 开发 
人 员 。 她 也 担 有 阿尔 伯 塔 大 学 的 学 士 学 位 。 





Murphy 博 士 主 要 工作 于 构造 更 简单 有 效 的 工具 来 帮助 开发 人 员 管 理 软件 演化 的 任务 。2005 
年 ， 她 拿 到 了 UBC 的 Killam 研 究 奖学金 ， 并 获得 了 AITO Dahl-Nygaard 青 年 奖 以 表彰 她 对 软件 演 
化 的 贡献 。2006 和 年， 她 多 得 了 NSERC 的 Steacie 奖 学 金 和 CRA-W Anita Borg 早 期 职业 奖 。2007 年 ， 
她 帮助 共同 创办 了 Tasktop 科 技 有 限 公 司 ， 并 现任 董事 会 主席 和 CEFO 。2008 年 ， 她 出 任 ACM 
SIGSOFT FSE 大 会 的 程序 委员 会 主席 并 获得 了 华 恬 顿 大 学 工程 学 院 的 早期 职业 钻石 奖 。2012 年 ， 
她 会 担任 软件 工程 国际 大 会 的 程序 联合 主席 。 她 目前 是 《ACM 软 件 工程 会 刊 》 厅 志 的 副 主 编 ， 
也 是 《ACM 通 讯 》 的 编辑 委员 会 成 员 。 她 事业 中 最 有 收获 的 事情 是 有 机 会 与 许多 有 才华 的 本 科 
生 与 研究 生 协 作 。 











Nachiappan Nagappan 是 微软 研究 院 软 件 可 靠 性 研究 小 组 的 资深 研究 员 。 他 的 主要 研究 领 
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北 卡罗来纳 州立 大 学 获得 的 。 


Andy Oram 是 OReilly 媒体 的 编辑 。 他 在 O"Reilly 的 工作 包括 2005 年 开创 性 书籍 Running 
Linux、 影 啊 2001 年 的 标题 Peer-to-Peer、2007 最 畅销 的 《代码 之 美 》 (Beautiful Code)。Andy 也 经 
第 为 OReilly 网 络 和 其 他 出 版 物 写 东西 ， 关 于 互联 网 相关 的 政策 问题 和 影响 技术 创新 及 其 社会 影 
啊 的 趋势 。 体 现 他 工作 的 印刷 出 版 物 包括 《经 济 学 家 了》 CACM), Copyright Worldy iA KE. 
联网 法 律 与 商业 》。 





Thomas Ostrand 是 AT&T 新 六 西 弗 阁 厄 姆 公园 实验 室 信 息 和 软件 系统 研究 部 的 首席 技 
术 人 员 。 他 当前 的 研究 兴趣 包括 软件 测试 的 生成 和 评 佑 、 缺 陷 分 析 和 预测 、 软 件 开发 和 测试 
工具 。 





加 入 AT&T 之 前 ，Ostrand 博 士 和 西门 子 公司 研究 部 、Sperry Univac、 罗 格 斯 大 学 计算 机 科学 
院 合作 过 。 他 是 ACM 的 高 级 会 员 ， 也 古 ACM/SIGSOFT 执 行 委员 会 的 高 层 委 员 。 他 曾 做 过 软件 神 
试 和 分 析 国 际 研讨 会 以 及 软件 工程 预测 模型 PROMISE 大 会 的 程序 主席 和 督导 委员 会 成 员 。 他 目 
前 古 《 实 证 软件 工程 》 杂 志 的 副 主编 ， 也 古 《IEEE 软 件 工程 会 刊 》 的 前 任 副 主 编 。 


Dewayne E. Perry 是 德 殉 了 萨 斯 大 学 奥 斯 订 分 校 软 件 工程 部 的 摩托 罗拉 校 盏 主席 。 他 的 前 三 分 
之 一 软件 工程 生涯 是 一 名 专业 软件 开发 者 , 然后 合并 了 人 研究 ( 卡 内 基 梅 隆 大 学 计算 机 科学 院 的 客 
座 教员 )、 软 件 架 构 以 及 设计 咨询 。 之 后 的 16 年 他 在 新 浪 西 默 里 山 的 贝尔 实验 室 做 软件 工程 的 研 
究 。 他 从 2000 年 1 月 开始 在 德 殉 院 斯 大 学 奥 斯 订 分 校 任 职 。 

他 在 实证 研究 、 软 件 流 程 的 正规 模型 、 流 程 和 产品 支持 环境 、 软 件 架 构 及 形式 和 技术 规 玫 方 
面 进行 了 开创 性 的 研究 。 他 对 架构 在 多 站 点 软件 开发 中 的 地 位 及 其 在 产品 线 中 投资 公司 软件 资产 
的 角色 特别 感 兴趣 。 

他 是 ACM SIGSOFT 和 IEEE Computer Society (IEEE 计 算 机 学 会 ) 的 会 员 。 曾 担任 过 各 种 软 
件 工程 大 会 的 组 织 主 席 、 程 序 主席 和 程序 委员 会 成 员 。 他 曾经 是 Wileys Software Process: 
Improvement & Practice(《Wiley 软 件 流 程 : 改进 和 实践 》) 的 共同 主编 ， 也 是 《IEEE 软 件 工程 会 
刊 》 的 前 任 副 主编 。 








Marian Petre 是 英国 开放 大 学 (Open University) 的 计算 机 教授 和 计算 研究 中 心 的 主管 。 她 
拥有 旦 家 学 会 添 尔 夫 森 优 秀 研 究 奖 ,以 表彰 她 在 软件 设计 方面 的 实证 研究 。 她 的 研究 侧重 于 专业 
软件 设计 中 的 专家 论证 和 代表 性 。 她 也 是 实证 研究 方法 的 创新 教育 者 , 编写 了 几 本 书籍 , 包括 The 
Unwritten Rules of PhD Research (《 博 士 研 究 生 的 不 成 文 规定 》， 现 已 第 二 版 ) 以 及 4 Gentle Guide 
to Research Methods (《 研 究 方法 的 温柔 指 两 》)。 
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Lutz Precheltethtk A HAE CERA. EARE EM ABE, 神经 网 络 学 习 、 
aE cs PLA AT ERA, 之 后 转移 至 实证 软件 工程 。 他 也 曾 做 过 软件 开发 人 员 和 软件 开发 经 
理 。 现 在 ,他 的 研究 重点 在 软件 流程 的 定性 和 定量 研究 上 ,特别 是 敏捷 流程 ， 以 及 人 研究 方法 论 和 








Rahul Premraj 是 阿姆斯特丹 目 由 大 学 计算 机 科学 院 的 副教授 。 他 2002 年 从 瑞 国 罗伯特 戈 登 
大 学 獒 得 了 信息 系统 贷 士 学 位 ，2007 年 从 瑞 国 伯 恩 芭 斯 大 学 获得 了 博士 学 位 。 他 的 研究 兴趣 包括 
实证 软件 工程 、 软 件 档案 挖 据 、 软 件 质 量 保 障 、 分 布 式 软件 开发 和 软件 流程 改进 。 


Forrest Shull 博 士 是 马里 兰 弗 劳 恩 霍 夫 (Fraunhofer) 实验 性 软件 工程 中 心 (FC-MD) 的 分 
区 主任 。 该 中 心 是 一 个 非 合 利 的 研究 和 技术 转移 组 织 ,， 他 在 那里 带领 度量 和 知识 管理 分 区 。 他 也 
是 马里 兰 大 学 帕克 分 校 的 兼职 副教授 。 

在 FC-MD， 他 曾 是 NASA 办 公 室 安全 和 任务 保障 、NASA 安 全 中 心 、 美 国 国 防 部 、 美 国 国家 
科学 基金 、 国 防 部 高 级 研究 计划 局 以 及 摩托 罗拉 和 富士 通 美国 实验 室 等 项 目的 首席 研究 员 。 他 也 
为 NASA 的 工程 师 开 发 并 教授 了 几 个 软件 度量 和 检查 的 课程 。 

从 2007 年 起 ，Forrest 担 任 IEEE Software (IEEE 软 件 ) 实证 结 末 部 门 的 副 主编 和 热门 的 “Voice 
of Evidence” 《证 据 之 声 ) 部 门 的 编辑 。 他 将 在 2011 年 就 任 《IEEE 软 件 》 的 主编 。 他 也 是 《实证 
软件 工程 杂志 》 的 编辑 部 成 员 。 


Beth Simon 走 加 州 大 学 圣地 亚 哥 分 校 计 算 机 科学 与 工程 系 的 教员 。 她 的 研究 着 重 在 计算 机 科 
学 的 教育 上 ， 特 别 对 (大 学 和 产业 界 的 ) 计算 机 新 手 、 同 行 指令 以 及 评估 感 兴 趣 。Simon 博 士 在 
代 顿 大 学 获得 了 计算 机 科学 的 学 士 学 位 , 在 加 州 大 学 圣地 亚 妈 分 校 计算 机 科学 与 工程 系 获得 了 倾 
士 和 博士 学 位 。 





Diomidis Spinellis 是 希腊 雅典 经 济 与 商业 大 学 管理 科学 与 技术 系 的 教授 。 他 的 研究 兴趣 包括 
软件 工程 、 计 算 机 安全 、 编 程 语言 等 。 他 写 了 两 本 获奖 的 Open Source Perspective (开源 视点 ) 书 
籍 : Code Reading (《 代 码 阅 读 》) 和 Code Quality (《 代 码 质 量 》)， 也 写 过 几 十 篇 科技 文章 。 

Spinellis 博 士 是 《IEEE 软 件 》 的 编辑 委员 会 成 员 ， 专 栏 “Tools of the Trade” (贸易 工具 ) 的 
作者 。 他 也 是 FreeBSD 的 提交 者 ，UMLGraph 及 其 他 开源 软件 包 、 库 、 工 具 的 开发 者 。 他 拥有 软 
件 工程 的 工程 硕士 和 计算 机 科学 的 博士 学 位 ， 均 在 伦敦 帝国 学 院 歼 得 。Spinellis 博 士 是 ACM 和 


IEEE 的 资深 会 员 ， 也 是 Usenix 协 会 的 会 员 。 








Neil Thomas 是 Google 的 软件 工程 师 。 他 工作 在 HIMLS 的 移动 应 用 程序 上 上， 包括 Gmail 和 
Google Buzz， 试 图 持续 推进 移动 网 络 并 重新 定义 网 络 训 览 右 的 可 能 性 。 他 曾 获 多 项 专利 。 他 也 
置 导 于 Google 的 内 部 工具 研发 ， 来 改善 程序 员 的 生产 力 。 

Thomas 先 生 2010 年 从 英 属 哥伦比亚 大 学 (UBC) 得 到 了 计算 机 科学 的 学 士 学 位 。 在 他 大 学 
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的 最 后 一 年 ， 他 有 第 与 Gail Murphy 一 起 工作 于 软件 实践 实验 室 。 他 的 研究 探索 了 开发 人 员 如 何 
理解 并 推 豆 复杂 系统 的 模块 化 。 


Walter F. Tichy 从 1986 年 开始 在 德国 卡尔 斯 鲁 厄 理工 学 院 (前 卡尔 斯 鲁 厄 大 学 ) 任 计 算 机 科 
学 教授 ，2002 年 至 2004 年 担任 计算 机 科学 院 院 长 。 他 也 是 FZI (卡尔 斯 鲁 厄 的 一 个 技术 转移 中 心 ) 
的 主任 。 他 的 主要 研究 兴趣 是 软件 工程 和 并 行 化 ,。 20 世 纪 80 年 代 , 他 创立 了 修订 控制 系统 (RCS), 
一 个 基于 CVS 的 版 本 管理 系统 ， 至 今 仍 在 全 球 这 围 内 使 用 。Tichy 博 士 在 学 生 时 代 初 次 接触 了 并 
行 计算 ， 那 是 由 16 个 PDP-11 计 算 机 组 成 的 并 行 计算 机 C.mmp 在 CMU 问 世 的 时 候 。 他 在 20 世 纪 80 
年 代 也 工作 于 连 线 机 和 一 系列 并 行 计算 机 上 ， 并 和 其 他 学 生 一 起 开发 了 Parastation 一 一 能 运行 
2009 年 6 月 500 强 中 排名 前 十 的 机 器 。 





Tichy 博 士 在 1980 年 从 卡 内 基 梅 隆 大 学 获得 了 计算 机 科学 博士 学 位 。 他 的 论文 是 第 一 篇 讨论 
软件 架构 的 。 由 于 他 坚持 软件 研究 者 需要 用 实证 研究 测试 他 们 的 断言 而 不 是 依赖 直觉 ， 因 而 引发 
了 争议。 他 进行 过 众多 对 照 实验 ,测试 类 型 检查 、 继 承 深 度 、 设 计 模 式 、 测 试 方法 和 敏捷 方法 等 
对 程序 员 生 产 力 的 影 啊 。 


Burak Turhan 是 芬兰 北部 奥 户 大 学 信息 处 理科 学 系 的 博士 后 研究 员 。 在 移居 分 兰 之 前 , 他 是 
加 拿 大 国家 人 研究 理事 会 信息 技术 研究 所 的 副 研 究 员 。 他 拥有 伊斯坦布尔 博 阿 齐 奇 大 学 计算 机 工程 
博士 学 位 。 他 的 研究 重点 包括 软件 质量 的 实证 研究 , 在 软件 工程 中 运用 机 如 学 习 和 数据 挖 据 的 方 
法 来 进行 缺陷 和 成 本 模型 ， 敏 捷 、 精 益 软 件 开 发 (特别 关注 测试 驱动 开发 )。 





Elaine Weyuker 是 AT&T 软件 工程 研究 员 。 在 来 到 AT&T 之 前 ， 她 是 纽约 大 学 Courant 数 学 科 
学 研究 所 的 计算 机 科学 教授 。 她 当前 的 研究 着 重 于 软件 缺陷 预测 、 软 件 测 试 、 软 件 指标 和 度量 。 
在 早 前 的 生活 中 ，Elaine 人 研究 过 计算 理论 ， 与 Martin Davis 和 Ron Sigal 一 起 写 J Computability, 
Complexity, and Languages (《 可 算 性 、 复 杂 性 和 语言 》)。 

Elaine 曾 在 2010 年 获得 了 ACM 总 统 奖 ， 在 2009 年 歼 得 了 ACM SIGSOFT E PRERE xK., 
2008 年 获得 了 Anita Borg 学 院 技 术 领 导 奖 ，2007 年 获得 了 ACM SIGSOFT 杰 出 研究 奖 。 她 也 古 美国 
国家 工程 院 院 士 、IEEE 院 士 、ACM 院 士 ， 并 因为 杰出 的 软件 工程 研究 获得 过 IEEE 的 Harlan Mills 
奖 、 罗 格 斯 大 学 50 周 年 杰出 校友 奖 、AT&T 主 席 多 元 奖 、 也 被 YWCA 命 名 为 “成 吏 女 性 "。 他 厦 
ACMA FHSS ACM-W) 的 主席 ， 也 是 多 元 计算 联盟 的 执行 委员 会 成 员 。 


Michele Whitecraft 是 一 个 充 诺 和 活力 的 老师 、 讲 师 和 研究 员 。 她 用 一 个 整体 的 、 跨 学 科 的 方 
法 来 执教 ， 并 积极 推进 妇女 参与 科学 。 她 获得 过 优秀 中 学 科学 教育 总 统 奖 、Tandy 学 者 教师 奖 、 
卓越 教育 总 督 奖 。 根 据 她 在 能 源 部 、 国 家 科学 基金 、 国 家 环境 健康 科学 研究 院 、 国 家 卫生 研究 
院 、 国 家 航空 航天 协会 所 获得 的 独特 研究 咨询 经 验 ，Michele 把 科学 课程 与 真实 世界 的 实验 联系 
起 来 , 实验 范围 从 普林斯顿 的 国际 热 核实 验 反 应 扒 到 加 州 大 学 伯克利 分 校 的 人 工 妨 变 超 铀 元 素 。 
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PATENA AA ee, e T Le Se SCR IG Fd 7 A PP Ae , 
并 在 各 大 全 国 性 的 会 议 中 做 了 演讲 。 她 在 BiosSciemrce Journal of Nuclear Materials Human Ecology 
和 Encyclopedia of Ethics 中 都 发 表 过 文章 。 

Michele 在 这 些 国家 级 组 织 和 研究 项 目 中 的 经 验 沿 发 了 她 帮助 所 有 学 科 推 进 女 性 参与 度 的 交 
望 ， 她 试图 实现 NSF 在 2020 年 之 前 达到 科学 参与 者 性 别 比 例 50-50 的 目标 。Michele 是 美国 化 学 学 
会 、 美 国 先进 科学 协会 、 妇 女工 程 师 协会 、 美 国 大 学 妇女 协会 、 课 程 开 发 与 监督 协会 和 国家 科学 
教育 研究 协会 的 成 员 。Michele 拥 有 课程 与 教学 的 硕士 学 位 ， 目 前 是 康 奈 尔 大 学 学 习 、 教 学 与 社 
会 政策 的 博士 生 。 





Laurie Wiliams 博 士 是 北 卡 有 罗 来 纳 州立 大 学 的 副教授 。 她 获得 了 理 海 大 学 工业 工程 的 本 
科学 位 ， 杜 元 大 学 的 MBA ， 以 及 犹他 大 学 计算 机 科学 博士 学 位 。 在 回 到 学 术 界 读 博 士 忆 前， 
她 在 IBM 工 作 了 9 年 。Laurie 是 Pair Programming Illuminated (人 《结对 编程 解析 》) 的 第 一 作者 ， 
Extreme Programming Perspectives(《 极 限 编程 透视 》) 的 共同 编辑 。 她 是 极限 编程 世界 大 会 的 
创始 人 ， 现 在 该 会 议 演 变 成 了 敏捷 软件 开发 大 会 。 她 进行 了 多 次 极限 编程 和 敏捷 开发 实践 的 
实证 研究 。 





Wendy M. Wiliams 博 士 是 康 么 尔 大 学 人 类 发 展 系 的 教授 ， 她 在 那里 学 习 了 智力 的 开发 、 评 
估 、 增 训 以 及 社会 影 啊 的 多 种 形式 。 她 写 了 9 本 书 、 编 了 5$ 卷 书 、 写 了 几 十 篇 文章 ， 包 括 2007 年 的 
APA=54# Why Arent More Women in Science?， 获 得 了 2007 年 独立 出 版 两 图 书 奖 ， 以 及 2010 年 与 
Stephen Ceci 合 著 的 牛津 书籍 The Mathematics of Sex: How Biology and Society Conspire to Limit 
Talented Women and Girls , 

Williams EZR SPARE DEEDS AY PMR, =U EEE ES AR aR 
也 是 各 种 专业 学 会 的 会 员 。 她 的 研究 在 《 目 然 汶 《新 闻 周 刊 》 《商业 周刊 》 《科学 》 《科学 美国 
KY, 《纽约 时 报 》《 华 辟 顿 邮 报 》 《今日 美国 》《 费 城 问 询 报 》 《高 等 教育 纪事 》 《儿童 杂志 》 
等 媒体 出 版 物 中 均 有 刊登 。2009 年 ,她 发 起 了 国家 卫生 研究 院 资 助 的 康 么 尔 大 学 妇女 与 科学 研究 
所 ， 人 研究 和 促进 女性 科学 家 事业 的 研究 推广 中 心 。 








Greg Wilson 征 “软件 木 乒 ”项 目的 珊 头 人 ， 这 征 一 个 针对 科学 家 和 工程 师 的 基本 软件 开发 
技巧 速成 班 。 在 之 前 的 生活 中 ,他 做 过 程序 员 、 作 者 和 教授 。Greg 有 爱丁堡 大 学 计算 机 科学 的 博 
士 学 位 。 他 是 一 位 自 坚 的 加 拿 大 人 。 


Andreas Zeller 是 德国 院 尔 大 学 的 软件 工程 教授 。 他 的 研究 关注 大 型 软件 系统 的 分 析 ， 特 别 
是 它们 的 执行 和 开发 历史 。 他 是 自动 化 调试 (“为 什么 我 的 程序 会 失败 ?”) 和 软件 档案 挖 据 (“大 
部 分 的 缺陷 发 生 在 哪里 ?””) 的 先驱 。 





Thomas Zimmermann 从 帕 绍 大 学 获得 计算 机 科学 文 适 ， 并 从 德国 院 尔 大 学 获得 了 博士 学 
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位 。 他 是 微软 研究 院 软 件 可 徘 性 研究 小 组 的 研究 员 , 也 是 卡尔 加 里 大 学 计算 机 科学 系 的 兼职 助理 
教授 。 他 的 研究 兴趣 包括 实证 软件 工程 、 软 件 知识 库 挖 据 、 软 件 可 徘 性 、 开 发 工具 和 社交 网 络 。 
著名 的 研究 包括 系统 挖 据 版 本 档案 和 缺陷 数据 库 ， 以 实施 实证 研究 来 构建 工具 支持 开发 者 和 人 省 
理 者 。 

Zimmermann EH EHR 了 ICSM 关 于 软件 工程 之 谜 的 工作 会 议 (2007 年 MythSE)， 软 件 缺 
陷 工 作坊 (2008 年 和 2009 年 DEFECTS) 和 软件 工程 的 推荐 系统 (2008 年 和 2010 年 RSSE)。 他 获 
得 了 两 次 ACM SIGSOFT 太 出 论文 奖 ， 以 表彰 他 在 07 年 ICSE 和 08 年 FSE 大 会 所 发 表 的 工作 。 他 曾 
在 各 种 程序 委员 会 任职 ， 包 括 ICSE、MSR、PROMISE、ICSM 和 ACM 推 荐 系统 大 会 (RecSys ) 。 
他 是 2010 年 和 2011 年 MSR 程 序 委员 会 的 联合 主席 。 他 的 主页 是 http://thomas-zimmermann.com。 
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